主页-[豪迪娱乐]「主页」?陆续收到不少读者的订阅,每期我们会精选一些AI新闻和产品及论文给到读者不一样的体验...同时也希望有一定的激励来持续运营,所以早些时间发布了赞助席位,现在将它进行清晰地调整,如果你也相信内容长尾效应和复利(尤其现在公众号的算法推荐影响),不妨可以尝试一下,我们也在尝试这种形式,如下:
价格:每期388 元(原价688)(可按期赞助,我们也希望可长期合作,费用会低些)
一个美妙的开头:Midjourney在圣诞前,发布其最新生图版本V6,似乎告诉人们没有什么现实是MJ创造不到的,也没有什么想象力是MJ复现不到的。以下这张图,展示了Midjourney的进化史,也是一部生成式AI进化史。尽管过去很长一段时间网络上讨论Midjourney并不多,但现在它又将AI生图的天花板拉上一层。这部进化史,也让人们看到,明年,AI生成视频、音频、音乐,可能将会带来史无前例的冲击,我们可能要做好心理准备。
OpenAI更新了ChatGPT,用户可以自主存档聊天记录。只需在“设置”中查看已存档的聊天记录即可,意味着它可以成为你GPTs的知识库,创建更个性化的GPTs
Midjourney官推发布V6版本,并正进行 alpha 测试。只需键入 /settings 并单击 V6 或在提示后添加--v 6 即可,一段自然语言,无需加入HDR、8K等参数设置,即可生成高质量图片,初步文字效果惊人,整体图像连贯性和即时理解能力大大提高了。
AI视频卷中卷,DreaMoving过去一周被成为短视频的舞蹈大师。DreaMoving 是一个基于扩散的可控视频生成框架,用于生成高质量的定制人类视频,几乎每个流行的短视频舞蹈它都可以帮你生成,只需一个形象照片,就可以舞动“青春”。
4.Google发布VideoPoet:用于零镜头视频生成的大型语言模型
最近一波视频生成模型突然出现,在许多情况下展示了令人惊叹的如画质量。当前视频生成的瓶颈之一是产生连贯大运动的能力。在许多情况下,即使是当前领先的模型也会产生较小的运动,或者当产生较大的运动时,会表现出明显的伪影。因此,Google引入了VideoPoet,这是一种大型语言模型(LLM),能够执行各种视频生成任务,包括文本到视频、图像到视频、视频风格化、视频修复和修复,以及视频转音频。
Meta 发布了一个名为“Fairy”文字对视频进行编辑的项目,按官方介绍,Fairy图像编辑扩散模型的简约而强大的改编,增强了它们的视频编辑应用程序。我们的方法以基于锚的跨帧注意力的概念为中心,这是一种隐式跨帧传播扩散特征的机制,确保卓越的时间一致性和高保真度合成。Fairy 不仅解决了以前模型的限制,包括内存和处理速度。它还通过独特的数据增强策略提高了时间一致性。该策略使模型与源图像和目标图像中的仿射变换等变。Fairy 效率极高,只需 14 秒即可生成 120 帧 512x384 视频(30 FPS 时长 4 秒),比之前的作品至少快 44 倍。
AI又对工业设计动手,Text-to-CAD 是一个开源提示界面,用于通过文本提示生成 CAD 文件。生成可以导入到您选择的 CAD 程序中的模型。Text-to-CAD 背后的基础设施利用我们的设计 API 和机器学习 API 以编程方式分析训练数据并生成 CAD 文件。
AnyDoor,一种基于扩散的图像生成器,能够以和谐的方式将目标对象传送到用户指定位置的新场景。我们的模型不需要调整每个对象的参数,而是只训练一次,并在推理阶段轻松地推广到不同的对象场景组合。这种具有挑战性的零样本设置需要对某个对象进行充分的表征。为此,我们用细节特征来补充常用的身份特征,这些细节特征经过精心设计,以保持纹理细节,同时允许多种局部变化(例如,照明、方向、姿势等),支持对象与不同环境的良好融合。我们进一步建议借用视频数据集中的知识,我们可以观察单个对象的各种形式(即沿时间轴),从而获得更强的模型通用性和鲁棒性。大量的实验证明了我们的方法相对于现有替代方案的优越性,以及它在现实世界应用中的巨大潜力,例如虚拟试穿和物体移动。
这是一款文生音乐的AI工具,区别于其它只生成beat的AI工具,它可以生成歌词和节奏以及演唱,是完成度很高的文生AI工具了,很难想象明年它会发展成什么样,也许可以创建一个专辑。
据Bloomberg报道,OpenAI正在初步谈判中,计划以1000亿美元的估值筹集新资金。这将是该公司迄今为止最高的估值。OpenAI是一家人工智能研究实验室,旨在开发和推动人工智能技术的发展。这次筹资将有助于OpenAI继续扩大其研发和商业化活动,推动人工智能领域的创新和进步。
微软CoPilot与Suno有力合作,推出了一款名为AI音乐生成器的插件,它可以在任何时候开始播放音乐,无论你在编码、会议还是休息。这款插件将基于你的行为和喜好来生成音乐,给你带来定制化的听觉体验。
Humane宣布,其引人注目的AI智能佩戴设备AI Pin将于2024年三月开始发货。优先下单的用户将首先收到设备,并根据购买日期按顺序发货。Humane并没有提供具体的发货日期,但比去年十一月提供的“2024年初”更加明确。在上个月的发布中,Humane展示了该设备如何根据不同的AI服务来回应用户的查询,而无需看屏幕。(尽管在展示视频中,一个AI回应出现了一个大错误。)该公司还展示了投影系统,可以在手上显示与用户互动的内容。然而,这一切的代价相当高昂,AI Pin的起价为699美元,并需要每月24美元的订阅费用来获得电话号码和使用蜂窝数据。
苹果的研究揭示了一些令人眼花缭乱的人工智能技术将加入你的iPhone。这些技术包括语音识别、图像识别、自然语言处理等,将使iPhone具备更智能的功能和更强大的性能。苹果希望通过这些AI技术提供更好的用户体验和更高的效率,为用户带来更多便利和创新。
亚马逊正在加大在AWS上的人工智能游戏的力度,以应对微软和谷歌的崛起。亚马逊希望通过AI技术提供更多的创新和解决方案,以满足不断增长的市场需求。该公司已经推出了一系列新的AI工具和服务,包括Amazon SageMaker Studio、Amazon CodeGuru、Amazon Monitron和Amazon Lookout for Vision等,以帮助开发者更好地构建和部署AI应用程序。通过这些创新,亚马逊希望能够在竞争激烈的AI市场中保持领先地位。
6.Harvey筹集了8000万美元,致力于为法律专业人士打造生成式人工智能
SiliconANGLE报道称,Harvey筹集了8000万美元的资金,致力于为法律专业人士打造生成式人工智能。Harvey的目标是利用人工智能技术提供更高效和智能的法律服务。他们的生成式人工智能系统可以自动生成法律文件、合同和法律建议,为律师和法律团队提供支持。这笔融资将帮助Harvey进一步发展其技术和扩大市场份额。
一种新型的超高速处理器将推动人工智能、无人驾驶等领域的技术发展。该处理器具有卓越的计算能力和效率,能够处理大规模的数据和复杂的算法。它将为人工智能应用提供更快速和高效的计算能力,为无人驾驶技术的发展提供强大的支持。这种新型处理器的问世将进一步推动人工智能和无人驾驶领域的创新和应用。
一位儿子利用人工智能技术,重新创造了他已故父亲的声音,作为圣诞节的特殊礼物。他找到了一个专门的公司帮忙重制声音,最终成功复原了父亲的声音,并以其制作成了一首歌,以此方式纪念他的父亲。
一款名为AI死亡计算器的工具可以准确预测你的死亡时间。这个工具使用人工智能技术和大数据分析来评估个人的生活方式、遗传背景和健康状况等因素,以预测一个人的寿命。据报道,这个AI计算器的准确性非常高,能够提供令人不安的准确预测。然而,这种工具引发了一些争议和担忧,因为它涉及到个人隐私和道德问题。
在达拉斯机场,人工智能正在帮助旅客找回他们的遗失物品。机场的失物招领部门利用人工智能技术,帮助寻找并归还旅客遗失的物品。旅客需要首先报告遗失的物品,然后系统会利用人工智能算法进行快速匹配和定位,以找到物品的准确位置。这项技术的引入大大提高了物品的寻回率,为旅客提供了更加便捷和高效的失物招领服务。
科学家们使用可解释的人工智能技术发现了60年来的第一种新抗生素。这项研究利用更透明的深度学习模型,发现了一种针对耐药金黄色葡萄球菌(MRSA)的新类抗生素。这项发现有望成为对抗抗生素耐药性的一次转折点。科学家们通过观察模型的学习过程,发现了某些分子适合作为良好的抗生素。这项研究成果发表在《Nature》杂志上,并由一个由21名研究人员组成的团队共同撰写。
据报道,研究人员开发出一种基于人工智能的深度学习算法,可以通过分析视网膜照片来诊断儿童自闭症。这项技术利用了人工智能的强大能力,通过对眼睛照片进行分析,能够准确地检测出自闭症的迹象。这项研究具有重要的意义,因为早期的自闭症诊断可以帮助孩子们尽早接受干预和治疗,提高他们的生活质量和发展潜力。
据报道,全球首家完全自主运营的餐厅即将在南加州开业。在“CaliExpress by Flippy”中,机器人将担任厨师的角色,包括烧烤和炸锅。它们将制作汉堡包、奶酪汉堡和薯条。Miso Robotics开发的Flippy是世界上第一个由人工智能驱动的机器人炸锅。该公司表示,Flippy可以与人类共同工作,提高食品质量和一致性,并为餐厅节省成本。该公司还表示,使用Flippy可以提高厨房的安全性,减少滑倒和烧伤的风险,同时还可以减少食物浪费。此外,餐厅还将使用PopID技术简化点餐和支付,并为客人提供个性化的点餐建议。位于帕萨迪纳市中心的“CaliExpress by Flippy”预计将于2023年12月开业,仅限预约。
谷歌计划利用人工智能工具自动化以前由员工完成的任务,以此来取代公司中的一些广告销售工作。该公司的新AI工具可以生成广告的关键词、标题、描述和其他资产,简化广告活动的创建过程。Performance Max工具使用生成式AI来创建自定义资产,并决定广告的放置位置。虽然使用AI工具不一定意味着裁员,但一些员工可能会被重新分配到谷歌的其他领域。据报道,谷歌预计在下个月宣布这些变化。这一举措意味着谷歌正进一步向自动化发展,以提高广告销售的效率和质量。
比尔·盖茨表示,到2025年,人工智能将在普通大众中得到广泛应用。他认为,人工智能技术的发展将改变各个行业和领域的运作方式,并为人们带来更多机会和便利。盖茨指出,人工智能可以应用于医疗保健、教育、交通、农业等各个领域,帮助解决现实世界面临的问题。他对人工智能的应用前景持乐观态度,并鼓励人们积极探索和应用这一技术。
让LogoFast帮助您轻松创建专业而独特的标志设计,无需设计经验。只需几分钟,您就可以拥有一个令人印象深刻的品牌标志。
DSCopilot是一款基于人工智能的解决方案,为电商卖家提供了许多功能,包括SEO增强、品牌提升、供应商选择和智能推荐等,以提升您的直销业务。
通过Rex.fit,您可以体验到定制化的健康转变,由AI营养和健身教练量身定制,无论您是想过更健康的生活、减肥还是增肌。与Rex交谈,开始您的健康之旅吧!
4.Sentiment Analysis Bot:情感分析的AI聊天机器
Sentiment Analysis Bot是一个情感分析的AI聊天机器人,可以帮助您了解用户的情感和反馈。它可以分析文本中的情感倾向,并提供有关情感的洞察和建议。
Serenica App利用人工智能将您的生活瞬间转化为冥想实践。无论您想要在重要的日子之前释放焦虑,还是希望获得更多内心平静,Serenica App都将为您提供个性化的冥想指导。
借助BlogSEO,您可以优化博客内容,利用AI驱动的策略提高流量和可见性。它提供了关键词分析、内容优化和推荐等功能,帮助您打造出更吸引人的博客内容。
Phron.io是一款AI投资助手,帮助您筛选股票、分析财务报表和进行贴现现金流分析。它提供了先进的过滤和排序选项,让您轻松寻找最佳的投资机会。
腾讯推出AppAgent,多模态智能体,让APP不再孤岛,自动联动完成任务,包括社交媒体、电子邮件、地图、购物和复杂的图像编辑工具。
AppAgent 是一种由大型语言模型提供支持的高级多模式代理,能够掌握和利用任何应用程序来执行复杂的任务。它通过直观的点击和滑动手势与应用程序交互,模仿人类的动作。
论文摘要:本文介绍了一种新颖的基于 LLM 的多模式代理框架,旨在操作智能手机应用程序。我们的框架使代理能够通过简化的动作空间来操作智能手机应用程序,模仿类人交互,例如点击和滑动。这种新颖的方法绕过了对系统后端访问的需求,从而扩大了其在不同应用程序中的适用性。我们的代理功能的核心是其创新的学习方法。代理通过自主探索或观察人类演示来学习导航和使用新应用程序。此过程生成一个知识库,代理可以参考该知识库来跨不同应用程序执行复杂的任务。为了证明我们代理的实用性,我们对 10 个不同应用程序的 50 项任务进行了广泛的测试,包括社交媒体、电子邮件、地图、购物和复杂的图像编辑工具。结果证实了我们的代理在处理各种高级。
1.可以冲,Perplexity豪横,给每个用户免费赠送2个月的Perplexity Pro会员体验。