AI前沿速报0521:北京AI产业创新伙伴计划|焦点简讯
AI技术正在不断发展,本期AI前沿速报为大家带来了前沿的AI资讯。我们将为您介绍北京启动人工智能产业创新伙伴计划、NIO投资Neo Fusion商业化控制核聚变、生成AI的未来及其对社会的影响等多个热门话题。我们鼓励大家关注、点赞、转发这篇内容,让更多的人了解AI技术的日新月异变化。
(资料图片仅供参考)
1. 【北京启动人工智能产业创新伙伴计划】
北京市启动了人工智能产业创新伙伴计划,旨在促进AI大模型的发展和应用,加速产业数字化转型。该计划包括五种伙伴类型:计算力、数据、模型、应用和投资。首批伙伴包括阿里云、百度、京东等39家公司。八项任务包括加速计算力供应、提供高质量训练数据、推广大模型应用等。该计划提供资金支持、优化服务、加强推广和支持人才发展,旨在到2025年建立完整和领先的人工智能产业。
2. 【蔚来投资Neo Fusion,旨在20年内商业化控制核聚变】
蔚来汽车投资1.5亿美元进入Neo Fusion,旨在20年内商业化控制核聚变。蔚来持有19.9%的股份,蔚来资本持有10.1%的股份,Fusion Energy持有其余70%的股份。控制核聚变被视为终极清洁和高效的能源来源,商业化将为电动汽车充电提供几乎无限的清洁能源。
3. 【生成AI的未来及其对社会的影响】
生成AI正在向人工通用智能(AGI)发展;微软重组研究实验室以探索AGI;谷歌升级Bard聊天机器人,OpenAI开发ChatGPT插件;AI监管是必要的,以避免负面结果;Ioannis Pitas教授认为,通过适当的监管,AI可以产生积极影响。
4.【AI改变数字广告行业的角色】
人工智能应用于广告定位、测量、个性化和优化;行业先行者必须谨慎实施技术;隐私风险和监管合规性至关重要;AI聊天可能威胁非AI搜索引擎;出版商之间存在收入分配的担忧;大型科技企业的人才分散可能导致小公司的AI进步。
5. 【Meta AI推出广告主生成AI沙盒】
Meta AI推出了AI沙盒,为广告主提供定制、背景生成和图像裁剪工具。该沙盒目前仅对一部分广告主开放,计划在7月份扩大范围。该沙盒旨在增强用户参与度、简化创意过程,并为品牌提供资源。
6. 【内部开发者门户和AI提高开发者体验】
内部开发者门户提供微服务和工具的访问,自助操作为开发者提供便利,平台工程团队赋予其他开发者权力,改善开发者体验对企业有影响。AI可以帮助减轻开发者的认知负荷。
7. 【DragGAN:交互式基于点的GAN生成图像操作】
德国马普计算机科学研究所、美国麻省理工学院和谷歌AR/VR联合开发了DragGAN,该技术允许用户控制图像的空间特征,具有灵活、准确和通用的特点。DragGAN在多个数据集上进行测试,表现优于UserControllableLT。当与GAN反演技术结合使用时,DragGAN对实际图片修改非常有效。
8. 【LETI:利用文本交互进行语言模型微调】
法国微电子研究所(LETI)提出了一种新的大型语言模型(LLM)微调范式,利用文本交互和反馈来提高性能。该方法在MBPP数据集上表现出更好的性能,并且使用更少的梯度步骤来实现文本反馈。这一研究有望进一步挖掘语言模型的潜力。
9. 【微软推出REACT:提高实时视频分析应用的AI方法】
微软研究人员开发了一种名为REACT的新型AI方法,利用边缘和云资源进行冗余计算,提高检测质量而不影响延迟,可应用于人体姿态估计和分割等其他情况。该方法将有助于提高实时视频分析应用的效率和准确性。
10. 【Salesforce AI推出CodeT5+:开源编码大型语言模型】
Salesforce AI推出了CodeT5+,这是一种新的开源编码大型语言模型,具有编码器-解码器架构,可用于分析和生成代码,适用于零-shot、微调和指令调整应用。该模型在零-shot HumanEval代码创建任务上取得了SOTA结果,并提供了灵活的单模态和双模态预训练目标模块。该模型已开源,供进一步研究使用。
11. 【探究生成AI对创意表现影响的“为什么”】
谷歌、Meta等平台使用生成AI工具;AI可以优化创意,但缺乏理解为什么某个创意表现更好的能力;全球品牌需要保持高质量和设计标准;AI可以与创意专业人士和专家携手合作,理解“为什么”。
12. 【本周应用动态:ChatGPT登陆iPhone,Bing AI更新,Instagram的Twitter克隆等】
本周应用经济中的消费下降了2%,达到1670亿美元,但下载量同比增长11%,达到2550亿次。OpenAI推出了ChatGPT的官方iOS应用程序。微软更新了Bing、SwiftKey和Skype的AI功能。Instagram正在开发Twitter克隆以发布短消息。苹果发布了更新的操作系统。乔治亚州在Apple Wallet中添加了驾驶执照和州身份证的支持。Twitter为Twitter Blue订阅者增加了视频上传限制。Meta为4月份的故障向广告商退款,并扩大了付费验证服务。Krafton获得了Battlegrounds Mobile India的批准。Epic Games投资于CLO Virtual Fashion。Artifact增加了一个功能,让记者和作家可以认领自己的个人资料。Pocket增加了新闻文章列表创建功能。Step推出了5%的储蓄账户。保时捷增加了Apple Maps EV路线支持。Hasan Minhaj成为Waze应用程序的个人导航员。
13. 【DreamGPT:一种基于GPT的开源解决方案,利用LLM幻觉】
DreamGPT利用大型语言模型(LLMs)的幻觉作为特征,刺激发散性思维,生成独特、创意的想法。它探索不同的用例并采用发散性思维,是一种开源解决方案,可以在PC或Mac上本地运行,无需GPU要求。在Github的Readme文件中提供样本。
14. 【SpeechGPT:一种具有内在跨模态对话能力的大型语言模型】
中国复旦大学和钱学森空间技术实验室的研究人员开发了SpeechGPT,它可以感知和生成多模态内容,并使用自监督训练将语音离散化并与文本统一。SpeechGPT建立在SpeechInstruct数据集上,用于多模态指令处理。经过三个阶段的训练,SpeechGPT在单模态、跨模态和口语对话任务中表现出强大的性能。研究人员认为SpeechGPT可能是人工通用智能(AGI)的一步。
15. 【苹果禁止使用ChatGPT和Copilot,Siri将推出新的AI功能】
苹果因数据泄露和安全问题禁止员工使用ChatGPT和Copilot。Siri将很快推出新的AI功能,代号为Bobcat,由John Giannandrea领导。苹果的最新语言模型预计将很快发布。ChatGPT因潜在传播错误信息和生成有害内容而受到批评。
16. 【Bard与ChatGPT:比较对话AI模型及其特点】
Bard和ChatGPT是两个备受关注的对话AI模型;Bard具有图像和代码解释、应用集成和语音输入等新功能;Bard可以访问互联网,提供实时答案,并生成复杂主题的摘要;Bard可以解释代码,提供实时翻译和个性化建议;Bard建立在谷歌最新的语言模型PaLM 2上。
17. 【OpenAI收到的捐款仅为15亿美元,马斯克捐赠金额存疑】
科技媒体TechCrunch发现,马斯克声称向OpenAI捐赠了1亿美元,但只有约1500万美元可以追溯到他。OpenAI成立以来共收到1.332亿美元的捐款,大部分资金来自于2019年成为营利性公司之前。2019年,OpenAI进行了重组,成立了营利性公司OpenAI LP,微软向其投资了10亿美元。OpenAI已经花费至少40亿美元开发ChatGPT和GPT-4。
18. 【评估ChatGPT和其他对话AI模型:表现和限制】
研究人员使用DSTC11客户服务数据集评估了对话AI模型。ChatGPT(gpt-3.5-turbo)表现最佳,Vicuna成为开源获胜者。更长的上下文窗口对于生成准确的响应很重要。在早期回合中,提示工程有用,但在更多上下文的后期回合中效果较差。存在幻觉、未能探索更多信息和重复内容的问题。使用批判工具箱来衡量模型输出和人类响应之间的相似性。通过长度比来确定冗长程度。即将举行的AI+EDA在线讨论会上,将邀请来自新硅技术和微软的演讲者。
感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿技术和应用。明天的速报,我们不见不散!