01

英伟达发布Nemotron-4 340B

AI资讯2024-06-17 | 英伟达发布Nemotron-4 340B&通义千问2荣获测评第一&​Luma AI翻车?

英伟达最新开源的Nemotron-4 340B模型家族,包括基础、指令和奖励模型,以其3400亿参数量级在AI领域引起轰动。该模型在98%合成数据训练下,展现出与GPT-4相媲美的性能,预示着未来各行业或将不再依赖昂贵的真实世界数据集。Nemotron-4 340B支持4K上下文窗口、多语言及编程语言,训练数据覆盖至2023年6月。其开源特性和高效的合成数据生成能力,为研究和商业应用开辟了新天地,同时也对数据隐私和安全性提出了新的挑战。NEWS

02

字节跳动与中科大联合推出TabPedia,理解复杂表格

AI资讯2024-06-17 | 英伟达发布Nemotron-4 340B&通义千问2荣获测评第一&​Luma AI翻车?

字节跳动与中科大合作,成功开发了一款名为TabPedia的统一表格理解大模型,该模型能够高效地处理多种表格理解任务,并通过概念协同机制整合不同源信息。TabPedia无需后处理即可精准识别表格位置和结构,直接在原始文档图像中实现多表格实例的识别。此外,该模型还能在表格问答任务中提供正确答案及相关理由,展现了在多种开放场景下的处理能力。为了评估模型性能,研究团队还构建了ComTQA数据集,包含约9k个高质量的表格问答对,并已在Huggingface平台开源。TabPedia的开发不仅提升了表格理解的技术水平,也为未来多模态大模型的研究提供了新方向。论文地址:
https://arxiv.org/abs/2406.01326
ComTQA数据集:
https://huggingface.co/datasets/ByteDance/ComTQA

NEWS

03

中山大学与联想团队推出AutoStudio,革新AI连环画创作

AI资讯2024-06-17 | 英伟达发布Nemotron-4 340B&通义千问2荣获测评第一&​Luma AI翻车?

中山大学与联想团队联合研发的AutoStudio,是一个无需训练的多智能体协同框架,能够处理复杂的人物互动并保持角色一致性。该框架利用三个基于大语言模型的智能体和扩散模型生成高质量图像,显著提升了连环画创作的效率和质量。AutoStudio在多轮交互式图像生成中表现出色,无论是定量还是定性评估均优于现有方法。该技术能够理解用户的自然语言指令,生成主题一致且高质量的连环画图像,为开放式故事生成和多主体多轮编辑提供了强大支持。论文链接:https://arxiv.org/abs/2406.01388
项目主页:https://howe183.github.io/AutoStudio.io/

NEWS

04

阿里云通义千问Qwen2模型荣获LiveBench AI测评全球第一

AI资讯2024-06-17 | 英伟达发布Nemotron-4 340B&通义千问2荣获测评第一&​Luma AI翻车?

阿里巴巴的通义千问最新开源的大模型Qwen2-72B在美国最新推出的大模型测评基准LiveBench AI中获得全球第一的佳绩,超越了Meta的Llama3-70B模型。LiveBench AI由图灵奖得主杨立昆联合其他机构推出,对全球34个顶尖的开闭源大模型进行了全面评估。Qwen2-72B不仅在前十榜单中排名最高,也是唯一的开源大模型和唯一的中国大模型。此外,通义千问Qwen系列共有7款模型入选榜单,下载量已超过1600万次,显示了其在AI领域的卓越影响力和广泛应用前景。NEWS

05

Luma AI的Dream Machine视频生成器遭遇网友吐槽

AI资讯2024-06-17 | 英伟达发布Nemotron-4 340B&通义千问2荣获测评第一&​Luma AI翻车?

Luma AI推出的Dream Machine,一个号称"下一代"文生视频的工具,在发布不久后遭遇了网友的广泛吐槽。原本预期能生成惊艳视频的Dream Machine,在实际使用中却产生了人物形象畸变和剧情离谱的结果,被网友调侃为"大型翻车现场"。尽管如此,网友们发现Dream Machine在生成表情包动画方面有意外的效果,将其戏称为"Meme Machine"。Dream Machine的主要问题在于视频内容连续性无法得到保证,人物在前后帧中可能会出现种族和性别的变化。尽管存在问题,但Dream Machine为那些对创造表情包动画感兴趣的网友提供了一个有趣的新选择。

声明:本站所有内容均为网络收集而来,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。