当前位置：快讯 > 正文

AI前沿速报0521:北京AI产业创新伙伴计划|焦点简讯

2023-05-21 15:58:51 AI前沿观察

AI技术正在不断发展，本期AI前沿速报为大家带来了前沿的AI资讯。我们将为您介绍北京启动人工智能产业创新伙伴计划、NIO投资Neo Fusion商业化控制核聚变、生成AI的未来及其对社会的影响等多个热门话题。我们鼓励大家关注、点赞、转发这篇内容，让更多的人了解AI技术的日新月异变化。

(资料图片仅供参考)

1. 【北京启动人工智能产业创新伙伴计划】

北京市启动了人工智能产业创新伙伴计划，旨在促进AI大模型的发展和应用，加速产业数字化转型。该计划包括五种伙伴类型：计算力、数据、模型、应用和投资。首批伙伴包括阿里云、百度、京东等39家公司。八项任务包括加速计算力供应、提供高质量训练数据、推广大模型应用等。该计划提供资金支持、优化服务、加强推广和支持人才发展，旨在到2025年建立完整和领先的人工智能产业。

2. 【蔚来投资Neo Fusion，旨在20年内商业化控制核聚变】

蔚来汽车投资1.5亿美元进入Neo Fusion，旨在20年内商业化控制核聚变。蔚来持有19.9%的股份，蔚来资本持有10.1%的股份，Fusion Energy持有其余70%的股份。控制核聚变被视为终极清洁和高效的能源来源，商业化将为电动汽车充电提供几乎无限的清洁能源。

3. 【生成AI的未来及其对社会的影响】

生成AI正在向人工通用智能（AGI）发展；微软重组研究实验室以探索AGI；谷歌升级Bard聊天机器人，OpenAI开发ChatGPT插件；AI监管是必要的，以避免负面结果；Ioannis Pitas教授认为，通过适当的监管，AI可以产生积极影响。

4.【AI改变数字广告行业的角色】

人工智能应用于广告定位、测量、个性化和优化；行业先行者必须谨慎实施技术；隐私风险和监管合规性至关重要；AI聊天可能威胁非AI搜索引擎；出版商之间存在收入分配的担忧；大型科技企业的人才分散可能导致小公司的AI进步。

5. 【Meta AI推出广告主生成AI沙盒】

Meta AI推出了AI沙盒，为广告主提供定制、背景生成和图像裁剪工具。该沙盒目前仅对一部分广告主开放，计划在7月份扩大范围。该沙盒旨在增强用户参与度、简化创意过程，并为品牌提供资源。

6. 【内部开发者门户和AI提高开发者体验】

内部开发者门户提供微服务和工具的访问，自助操作为开发者提供便利，平台工程团队赋予其他开发者权力，改善开发者体验对企业有影响。AI可以帮助减轻开发者的认知负荷。

7. 【DragGAN：交互式基于点的GAN生成图像操作】

德国马普计算机科学研究所、美国麻省理工学院和谷歌AR/VR联合开发了DragGAN，该技术允许用户控制图像的空间特征，具有灵活、准确和通用的特点。DragGAN在多个数据集上进行测试，表现优于UserControllableLT。当与GAN反演技术结合使用时，DragGAN对实际图片修改非常有效。

8. 【LETI：利用文本交互进行语言模型微调】

法国微电子研究所（LETI）提出了一种新的大型语言模型（LLM）微调范式，利用文本交互和反馈来提高性能。该方法在MBPP数据集上表现出更好的性能，并且使用更少的梯度步骤来实现文本反馈。这一研究有望进一步挖掘语言模型的潜力。

9. 【微软推出REACT：提高实时视频分析应用的AI方法】

微软研究人员开发了一种名为REACT的新型AI方法，利用边缘和云资源进行冗余计算，提高检测质量而不影响延迟，可应用于人体姿态估计和分割等其他情况。该方法将有助于提高实时视频分析应用的效率和准确性。

10. 【Salesforce AI推出CodeT5+：开源编码大型语言模型】

Salesforce AI推出了CodeT5+，这是一种新的开源编码大型语言模型，具有编码器-解码器架构，可用于分析和生成代码，适用于零-shot、微调和指令调整应用。该模型在零-shot HumanEval代码创建任务上取得了SOTA结果，并提供了灵活的单模态和双模态预训练目标模块。该模型已开源，供进一步研究使用。

11. 【探究生成AI对创意表现影响的“为什么”】

谷歌、Meta等平台使用生成AI工具；AI可以优化创意，但缺乏理解为什么某个创意表现更好的能力；全球品牌需要保持高质量和设计标准；AI可以与创意专业人士和专家携手合作，理解“为什么”。

12. 【本周应用动态：ChatGPT登陆iPhone，Bing AI更新，Instagram的Twitter克隆等】

本周应用经济中的消费下降了2％，达到1670亿美元，但下载量同比增长11％，达到2550亿次。OpenAI推出了ChatGPT的官方iOS应用程序。微软更新了Bing、SwiftKey和Skype的AI功能。Instagram正在开发Twitter克隆以发布短消息。苹果发布了更新的操作系统。乔治亚州在Apple Wallet中添加了驾驶执照和州身份证的支持。Twitter为Twitter Blue订阅者增加了视频上传限制。Meta为4月份的故障向广告商退款，并扩大了付费验证服务。Krafton获得了Battlegrounds Mobile India的批准。Epic Games投资于CLO Virtual Fashion。Artifact增加了一个功能，让记者和作家可以认领自己的个人资料。Pocket增加了新闻文章列表创建功能。Step推出了5％的储蓄账户。保时捷增加了Apple Maps EV路线支持。Hasan Minhaj成为Waze应用程序的个人导航员。

13. 【DreamGPT：一种基于GPT的开源解决方案，利用LLM幻觉】

DreamGPT利用大型语言模型（LLMs）的幻觉作为特征，刺激发散性思维，生成独特、创意的想法。它探索不同的用例并采用发散性思维，是一种开源解决方案，可以在PC或Mac上本地运行，无需GPU要求。在Github的Readme文件中提供样本。

14. 【SpeechGPT：一种具有内在跨模态对话能力的大型语言模型】

中国复旦大学和钱学森空间技术实验室的研究人员开发了SpeechGPT，它可以感知和生成多模态内容，并使用自监督训练将语音离散化并与文本统一。SpeechGPT建立在SpeechInstruct数据集上，用于多模态指令处理。经过三个阶段的训练，SpeechGPT在单模态、跨模态和口语对话任务中表现出强大的性能。研究人员认为SpeechGPT可能是人工通用智能（AGI）的一步。

15. 【苹果禁止使用ChatGPT和Copilot，Siri将推出新的AI功能】

苹果因数据泄露和安全问题禁止员工使用ChatGPT和Copilot。Siri将很快推出新的AI功能，代号为Bobcat，由John Giannandrea领导。苹果的最新语言模型预计将很快发布。ChatGPT因潜在传播错误信息和生成有害内容而受到批评。

16. 【Bard与ChatGPT：比较对话AI模型及其特点】

Bard和ChatGPT是两个备受关注的对话AI模型；Bard具有图像和代码解释、应用集成和语音输入等新功能；Bard可以访问互联网，提供实时答案，并生成复杂主题的摘要；Bard可以解释代码，提供实时翻译和个性化建议；Bard建立在谷歌最新的语言模型PaLM 2上。

17. 【OpenAI收到的捐款仅为15亿美元，马斯克捐赠金额存疑】

科技媒体TechCrunch发现，马斯克声称向OpenAI捐赠了1亿美元，但只有约1500万美元可以追溯到他。OpenAI成立以来共收到1.332亿美元的捐款，大部分资金来自于2019年成为营利性公司之前。2019年，OpenAI进行了重组，成立了营利性公司OpenAI LP，微软向其投资了10亿美元。OpenAI已经花费至少40亿美元开发ChatGPT和GPT-4。

18. 【评估ChatGPT和其他对话AI模型：表现和限制】

研究人员使用DSTC11客户服务数据集评估了对话AI模型。ChatGPT（gpt-3.5-turbo）表现最佳，Vicuna成为开源获胜者。更长的上下文窗口对于生成准确的响应很重要。在早期回合中，提示工程有用，但在更多上下文的后期回合中效果较差。存在幻觉、未能探索更多信息和重复内容的问题。使用批判工具箱来衡量模型输出和人类响应之间的相似性。通过长度比来确定冗长程度。即将举行的AI+EDA在线讨论会上，将邀请来自新硅技术和微软的演讲者。

感谢您的关注，AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动，点赞、评论、转发，让更多人了解AI的前沿技术和应用。明天的速报，我们不见不散！

为你推荐