贵州 切换城市

请选择您所在的城市:

    热门
    城市

    智头条

    发布投稿

    关注微信

    客服热线

    0571-28221460

    AI日报|马斯克:AI行业需要“裁判”;无需微调,大型语言模型即可自我调整_澎湃号·湃客_澎湃新闻

    2023-09-18 13:43:10

    来源:澎湃新闻 学术头条   作者:智能说

    阅读:11402

    评论:0

    今日值得关注的人工智能新动态:

    马斯克:AI行业需要“裁判”

    微软开源EvoDiff:新一代蛋白质生成式A

    Anthropic与BCG联手,为企业提供Claude 2的“直接访问”

    Arm成功上市,股价上涨25%

    综述:基于大型语言模型的代理的崛起与潜力

    物联网中的通用AI:机遇与挑战

    MMICL:通过多模态上下文学习增强视觉语言模型

    SingFake:歌声Deepfake检测神器

    文本引导的更逼真3D面部头像

    无需微调,大型语言模型即可自我调整

    01

    马斯克:AI行业需要“裁判”

    近日,美国参议员 Chuck Schumer 在参议院办公大楼举办了一场“人工智能洞察论坛(AI Insight Forum)”,讨论潜在的 AI 监管问题。与会者包括埃隆·马斯克、比尔·盖茨、马克·扎克伯格、OpenAI 的山姆·奥尔特曼和英伟达的黄仁勋等。22 名与会者中有 14 人是首席执行官,一些专家表示缺少关键声音。

    据路透社报道,马斯克表示,在这些科技重量级人物齐聚华盛顿讨论 AI 之后,人们对 AI 的监管达成了“压倒性共识”。马斯克主张 AI 行业需要“裁判”,他将 AI 的监管描述为类似于体育比赛,规则是确保公平竞争并保护参与者。“对我们来说,有一名仲裁员来确保公司采取安全且符合公众利益的行动非常重要”。

    另一方面,扎克伯格则希望推动政府和科技公司之间采取合作方式。他敦促国会“利用 AI 来支持创新和保障”,强调让美国公司制定全球标准的战略优势。

    上周,美国参议员 Richard Blumenthal 和 Hawley 提出了一个两党立法框架,要求从事 GPT-4 等“高风险”AI 应用的公司获得政府许可。

    02

    微软开源EvoDiff:

    新一代蛋白质生成式AI

    表征蛋白质可以揭示疾病的机理,包括减缓或逆转疾病的方法,而创造蛋白质则可以开发出全新的药物和疗法。然而,从计算和人力资源的角度来看,目前在实验室设计蛋白质的过程成本高昂。它需要提出一种能在体内执行特定任务的蛋白质结构,然后找到一种可能“折叠”到该结构中的蛋白质序列。

    日前,微软开源了一种通用的扩散框架 EvoDiff,它将进化尺度数据与扩散模型的独特调节能力相结合,可在序列空间中可控地生成蛋白质。EvoDiff 能生成高保真、多样化、结构上合理的蛋白质,涵盖自然序列和功能空间。重要的是,EvoDiff 可以生成基于结构的模型无法生成的蛋白质,如那些具有无序区域的蛋白质,同时还能保持设计功能结构主题支架的能力,这证明了基于序列公式的通用性。

    03

    Anthropic与BCG联手,

    为企业提供Claude 2的“直接访问”

    人工智能(AI)独角兽初创公司 Anthropic 宣布与波士顿咨询集团(BCG)合作,为其客户提供对 Claude 2 和 Anthropic AI 技术的“直接访问”。

    据介绍,Anthropic 将提供技术,而 BCG 将就其战略应用向客户提供建议,并帮助他们集成模型以获得业务成果。BCG 尚未公开分享 Anthropic AI 的具体应用,但已确认该集成将用于综合长篇文档和研究,包括支持市场研究和客户洞察综合。

    04

    Arm成功上市,股价上涨25%

    经过近两年的 IPO 市场干旱后,英国芯片设计公司 Arm 于周四在 Nasdaq debut 成功上市,当天收盘上涨 25%,公司市值达到约 650 亿美元。

    目前,苹果、三星、英伟达 和谷歌都在使用 Arm 的设计和指令来制造他们的芯片。根据上周提交的文件,苹果、谷歌、英伟达、AMD、三星和台积电等公司均表示有兴趣作为此次发行的基石投资者。

    05

    综述:基于大型语言模型的

    代理的崛起与潜力

    长期以来,人类一直在追求等同于或超越人类水平的人工智能(AI),而 AI 代理则被认为是实现这一追求的大有可为的工具。然而,社会各界缺乏一个足够通用和强大的模型,作为设计能适应各种场景 AI 代理的起点。

    该研究首先追溯了代理的概念,从其哲学起源到其在 AI 中的发展,并解释了为什么大型语言模型(LLMs)适合作为 AI 代理的基础,在此基础上,又提出了基于 LLMs 的代理概念框架,由大脑、感知和行动三个主要部分组成,该框架可根据不同应用进行定制。

    随后,研究人员又从三个方面探讨了基于 LLMs 的代理的广泛应用:单代理场景、多代理场景和人——代理合作。随后,他们深入探讨了代理社会,探索了基于 LLMs 的代理的行为和个性、它们组成社会时出现的社会现象以及它们为人类社会提供的启示。最后,又讨论该领域的一系列关键议题和开放性问题。

    论文:

    The Rise and Potential of Large Language Model Based Agents: A Survey

    06

    物联网中的通用AI:机遇与挑战

    通用人工智能(AGI)具有与人类认知能力相同的理解、学习和执行任务的能力,在科学、商业和社会领域引起了极大的期待和关注,这种魅力已经延伸到物联网(IoT)领域。该研究探索了在物联网背景下实现 AGI 的机遇和挑战。

    该论文首先概述了物联网的基本原理以及 AGI 在物联网系统中的关键作用,随后深入探讨了 AGI 的基本原理,并最终提出了一个将 AGI 无缝集成到物联网中的概念框架。

    此外,该论文还探讨了有限计算资源带来的限制、与大规模物联网通信相关的复杂性以及与安全和隐私相关的重要问题。

    论文:

    Towards Artificial General Intelligence (AGI) in the Internet of Things (IoT): Opportunities and Challenges

    07

    MMICL:通过多模态上下文学习

    增强视觉语言模型

    目前,大型语言模型(LLMs)可以通过上下文学习利用广泛的背景知识和任务信息,但大多数 视觉语言模型(VLM0仍然难以理解包含多幅图像的复杂多模态提示。尽管一些新提出的 VLM 可以处理带有多幅图像的用户提示,但与从网上抓取的交错图像和文本相比,预训练数据并不能提供更复杂的多模态提示。

    该研究提出了 MMICL,试图从模型和数据两个角度来解决这一问题。研究引入了一个精心设计的架构,能够以交错的方式无缝整合视觉和文本上下文以及 MIC 数据集,以缩小训练数据与实际应用中复杂的用户提示之间的差距。

    分析表明,MMICL 能有效地应对复杂的多模态提示理解挑战。在 ScienceQA-IMG 上的实验表明,MMICL 成功地缓解了 VLM 中的语言偏差问题。

    论文:

    MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning

    08

    SingFake:歌声Deepfake检测神器

    有声读物可以极大地提高文学作品的可读性,提高读者的参与度。然而,有声书的制作、编辑和出版需要耗费数百个小时的人力。

    该研究提出了一个可以从在线电子书自动生成高质量有声读物的系统。利用神经文本到语音技术的最新进展,从电子书库中创建并发布了数千本人类质量的开放许可有声读物。此方法可以识别电子书内容的适当子集,以阅读大量结构各异的书籍,还可并行处理数百本书籍。系统允许用户自定义有声读物的语速、风格和情感语调,甚至可以使用少量样本音频匹配所需的声音。这项工作贡献了五千多本开放许可的有声读物和一个互动演示,让用户可以快速创建自己的定制有声读物。

    论文:

    SingFake: Singing Voice Deepfake Detection

    09

    文本引导的更逼真3D面部头像

    虽然只用文字描述即可创建逼真 3D 面部头像,但现有方法缺乏真实感,会产生不切实际的形状,或不支持编辑。

    该研究使用合成模型生成头像,其中头部、面部和上半身使用传统的三维网格表示,而头发、衣服和配饰则使用神经辐射场(NeRF)表示。基于模型的网格表示法为面部区域提供了强大的几何先验性,在提高逼真度的同时还能对人物外观进行编辑。通过使用神经辐射场来表示其余部件,该方法能够对具有复杂几何形状和外观的部件进行建模和合成。新系统可根据文本描述合成这些高质量的合成头像。

    实验结果表明,利用该方法生成的头像更逼真,具有可编辑性。该功能支持虚拟试穿等应用。

    论文:

    Text-Guided Generation and Editing of Compositional 3D Avatars

    10

    无需微调,

    大型语言模型即可自我调整

    大型语言模型(LLMs)经常表现出与人类偏好不一致的情况。以往的研究收集了人类偏好数据,然后使用强化学习或指令调整(即所谓的微调步骤)对预训练模型进行对齐。相比之下,无需任何额外数据就能对齐冻结的 LLM 更具吸引力。

    北京大学、微软亚洲研究院、悉尼大学和滑铁卢大学的研究团队介绍了一种新颖的推理方法——可倒退的自动回归推理(RAIN),它允许预先训练好的 LLMs 评估自己的生成,并使用评估结果来指导后退和前向生成,以确保 AI 的安全性。

    该研究发现,通过整合自我评估和倒带机制,未对齐的 LLMs 可以通过自我提升直接产生符合人类偏好的反应。

    论文:

    RAIN: Your Language Models Can Align Themselves without Finetuning

    直播预告:

    ChatGLM大模型应用构建和指令工程

    本次报告从理论、技巧、案例多个角度剖析大模型应用构建和指令工程,结合一手的大模型行业探索经验,带你深入了解 ChatGLM 的强大功能,了解如何发挥 ChatGLM 的优势,为企业找到适合的落地大模型产品技术方案。

    原标题:《AI日报|马斯克:AI行业需要“裁判”;无需微调,大型语言模型即可自我调整;歌声Deepfake检测神器》

    关键词: 日报

    人已打赏

        ×

        打赏支持

        打赏金额
        • 1元
        • 2元
        • 5元
        • 10元
        • 20元
        • 50元

        选择支付方式:

        打赏记录
        ×

        精彩评论文明上网理性发言,请遵守评论服务协议

        共0条评论
        加载更多
        智能说

        智能说

        1550文章
        3737.9325万总阅读