By 李华
2024年6月26日
18
460
快手可灵:图生视频与视频续写功能创新
快手最新推出的可灵凭借其先进的图生视频和视频续写功能,着实在业界引起了不小的关注。这为大型语言模型开发和AI定制化开发提供了新思路。更值得一提的是,可灵的图生视频模型融入了强大的提示词融合技术,用户可以通过文本指令控制视频中对象的动态表现。这种能力使得视觉叙事可以根据需求进行定制,无论是教育行业AI解决方案还是税务AI咨询等行业应用,都将迎来新的机遇。
可灵在算法挑战更大的“视频续写”功能上也取得了突破。这一功能要求模型不仅要理解视频的基本元素和深层次的叙事结构,还需要创建新的情景,并保持视觉和主题的连贯性。在这方面,可灵成功展示了其强大的AI解决方案和AI企业解决方案,使得视频可以在原有基础上立即续写5秒。这为杭州AI定制开发和浙江AI解决方案市场提供了重要的技术参考。
视频续写功能的突破
可灵这一技术突破在教培行业AI应用和AI系统开发等领域有着广泛的应用前景,特别是在短视频平台、教育培训、税务咨询等行业中,将带来显著的效率提升和用户体验优化。对于在杭州和浙江寻求AI应用定制服务的企业来说,可灵提供的灵活性和高可控性无疑是一个理想的选择。
快手可灵最新上线的图生视频和视频续写功能。
“新智元”行业与地域应用
这种创新也充分回答了多个长尾关键词的问题,例如,如何利用AI提升企业效率。通过可灵提供的强大视频生成和续写功能,企业可以大大提升内容制作效率和质量,为营销和客户服务带来新的可能性。在ChatGPT在企业中的应用和使用Langchain框架的AI案例中,可灵的技术将为企业提供更加智能化和个性化的解决方案。
总而言之,快手可灵的图生视频和视频续写功能代表了AI解决方案和AI定制开发领域的一个重要进展。无论是在技术创新上,还是在行业应用和用户体验上,可灵都为未来的AI发展提供了新的可能性。
如有侵权,请联系删除。
体验企业级AI服务
联系产品经理,扫描下方企业微信二维码
Related Articles
- Thu Oct 10 2024
MIT和清华校友提出全新AI解决方案,优化Transformer节能性能
在大型语言模型开发中,能耗问题愈发突出,不仅引发全球关注,也成为ChatGPT开发的核心挑战。数据显示,2023年初,ChatGPT服务每日耗电量达到564兆瓦时,相当于18000个美国家庭的用电量。
- Wed Oct 09 2024
OpenAI获NVIDIA超强算力支持,推进AI解决方案研发
OpenAI近日接收了NVIDIA最新工程版DGX B200超算设备,为AI解决方案发展再添动力。这款搭载8块NVIDIA B200 GPU的系统,具备144 petaflops的AI算力,64TB/
- Tue Oct 08 2024
Meta版Sora深夜横空出世
Meta在AI领域再度创新,推出了Sora版的Movie Gen,一个集高参数和多功能于一体的媒体基础模型。这一AI解决方案不仅在文本提示下生成高质量高清图像和视频,更支持1080P、16秒、每秒16
- Mon Sep 30 2024
灵动会议:AI重塑会议协作,助力企业效率提升
在现代企业中,越来越多的公司试图通过整合大模型来优化视频会议系统。然而,许多企业在实际应用中仍面临诸多挑战,如AI新功能识别不准、设备兼容性差以及数据安全隐忧等。近日,声网在北京发布了其新产品——“灵
- Mon Sep 30 2024
NVIDIA RTX 5090性能怪兽即将登场!细节全揭秘
近期,多方消息源泄露了NVIDIA次世代旗舰显卡RTX 5090及RTX 5080的规格。RTX 5090 配备了惊人的 21760 个 CUDA 核心,提升高达 33%,显存采用最新的 GDDR7
- Tue Sep 24 2024
海德堡提出全新图语言模型
语言模型(LM)的成功似乎掩盖了很多其他的重要研究,比如知识图谱,这个整合了实体关系的结构化知识库。传统上,语言模型代表了语言理解的能力,而知识图谱包含了丰富的结构化信息。在AI定制开发和大型语言模型
- Mon Sep 23 2024
阿里Qwen2.5震撼发布,性能超越Llama3.1,开创AI新纪元
今日,阿里云发布了全球最强开源大模型Qwen2.5-72B,其性能“跨量级”超越了Llama3.1-405B,重新登顶全球开源大模型的王座。此次发布包含一系列Qwen2.5模型,如语言模型Qwen2.
- Thu Sep 19 2024
生命科学大模型ESM3发布,AI助力病毒进化探索
今年7月,被Meta解散的ESMFold团队重新聚集并发布了生命科学大模型ESM3,提出了「用语言模型模拟5亿年进化」的口号。生物学家们迅速捕捉到这个突破性模型的潜力,并开始利用ESM3进行病毒谱系重
- Wed Sep 18 2024
微软Office全家桶再爆办公革命,O1模型加持重塑十亿人工作流
微软于近日发布了其革命性的Copilot第二弹,在发布会上,CEO萨提亚·纳德拉宣布了一种全新的AI构思和协作工作流——Web+Work+Pages,标志着办公方式的划时代变革。此次发布会亮点众多,以
- Sat Sep 14 2024
OpenAI推出O1模型,门萨智商测试夺冠
OpenAI最新发布的O1模型,在门萨智商测试中取得了第一名的优异成绩。业界普遍认为,AI正在逐渐展示出意识,许多专家预测,到2024/2025年,AI将拥有真正的意识。这些猜测基于模型如今表现出的明
- Fri Sep 13 2024
OpenAI o1模型问世,五级AGI再突破
今日,OpenAI宣布推出全新O1模型,这一突破性的模型将在ChatGPT中提供给所有Plus和Team用户,并在API中面向tier 5开发者开放。同时,OpenAI还发布了O1-mini,这是一种
- Thu Sep 12 2024
微软官宣创建12个逻辑量子比特,联合AI首次破解化学难题。
微软官宣创造了史上性能最佳的逻辑量子比特,数量达12个。这些量子比特是通过改进Quantinuum的H2量子计算机(具备56个物理量子比特)实现的,展示了微软在量子纠错方面的卓越能力。短短三个月内,微
- Wed Sep 11 2024
亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
AI语音助手在近年来成为硅谷科技巨头争夺的焦点,AI解决方案在这一领域的应用备受关注。自OpenAI在5月发布「期货」GPT-4o的语音功能后,谷歌紧随其后,宣布推出Gemini Live语音聊天模式
- Tue Sep 10 2024
苹果发布首款AI手机:先进功能引领智能新时代
苹果公司近日发布了其首款AI手机,标志着智能手机行业的重大突破。苹果CEO库克在发布会上展示了最新的iPhone 16系列,包括iPhone 16、iPhone 16 Plus、iPhone 16 P
- Mon Sep 09 2024
国产首款AI Agent手机跑赢苹果
就在最近,Anthropic更新了其产品线,推出了Claude Enterprise(Claude企业版)。尽管企业版依然是Claude聊天机器人,但它具有显著的优势,其中最值得注意的两个亮点是原生集
- Fri Sep 06 2024
原生集成 GitHub:Claude 企业版的革命性更新
Anthropic 最近更新了其产品线,推出了新的 Claude Enterprise(Claude 企业版)。虽然企业版依然延续了Claude 聊天机器人,但它带来了一些显著的改进,尤其是原生集成
- Thu Sep 05 2024
Obsidian:整合LLM的最强笔记软件,为您的AI解决方案提供卓越支持
Obsidian是目前最受欢迎的笔记工具之一,但其能力远不止于此。不仅可以作为笔记本使用,Obsidian还可以成为您的个人知识库和文档生产力工具,许多用户更是将其誉为自己的「第二大脑」。与AI系统开
- Wed Sep 04 2024
智谱AI在KDD 2024上发布超大杯模型,展现强大AI解决方案
在西班牙巴塞罗那举行的KDD 2024数据挖掘大会上,智谱AI凭借其卓越的大模型技术引起了广泛关注。智谱AI的研究团队推出了一系列突破性的AI模型,尤其是在大语言模型日的活动中,顾晓韬博士介绍了支持中
- Tue Sep 03 2024
创新奇智在AI+制造领域初显成效,工业智能机器人迎来新方向
创新奇智在AI+制造领域中,尤其在大模型工业应用方面,已经初步展现出成果。这一现象引发了AI解决方案的深刻变革。尽管如OpenAI的ChatGPT已经有两亿每周活跃用户,Meta的Llama系列模型下
- Mon Sep 02 2024
科大讯飞推出极速超拟人交互,刷新语音交互体验
科大讯飞发布的「讯飞星火」版Her,是国内首个「极速超拟人交互」系统,目前已全民开放体验。传统语音交互面临三大挑战:准确理解说话人意图、生成恰当响应、以及高效的声音传达。而这个新系统实现了如真人般的自
- Fri Aug 30 2024
英伟达在最新MLPerf Inference测试中大放异彩,AI定制开发新突破
MLPerf Inference发布了最新测试结果,英伟达凭借全新的Blackwell架构芯片与谷歌和AMD在性能上展开激烈竞技,展示了显著的提升,刷新了部分任务的测试纪录。MLPerf是一个被广泛认
- Thu Aug 29 2024
谷歌推世界首个AI游戏引擎,2000亿游戏产业恐颠覆,0代码生成游戏
谷歌推出了全球首个完全由AI驱动的游戏引擎——GameNGen,将为2000亿美元的游戏产业带来革命性变化。谷歌研究团队训练的GameNGen能够以每秒20帧的速度实时生成DOOM游戏画面,逼真的画面
- Wed Aug 28 2024
智谱大模型有了首个免费的API
五月的谷歌I/O大会上,轻量化与高效响应的Gemini 1.5大模型Flash版登场。紧接着,七月OpenAI基于GPT-4o推出了Mini版,这款新模型不仅功能更强大,价格也更低,现在访问ChatG
- Tue Aug 27 2024
首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告。
浙大和港中深等顶尖机构最新发布的报告揭示,人工智能(AI)和虚拟现实(VR)技术的结合,正在为多个领域提供前所未有的交互式体验,而医疗领域被认为是这一结合最具发展潜力的应用场景。报告将当前的AI+VR
- Mon Aug 26 2024
空间计算+手机,会是移动影像的下一站吗?
移动影像如何才能更“极致”?下一个“突破点”又会在哪里?显然,AI大模型的崛起是一个新的契机,或将彻底重构影像算法的底层架构。同时,空间计算的火爆也成为了智能手机巨头们瞄准的关键方向。苹果Vision
- Thu Aug 22 2024
顶尖Phi 3.5模型系列:微软小语言模型的全新升级
微软正式发布了Phi小语言模型系列的最新版本——Phi 3.5,一口气连发三款模型。虽说这三款模型规模较小,但在许多第三方基准测试中表现卓越,甚至在某些情况下超越了其他领先的大模型,包括谷歌的Gemi
- Wed Aug 21 2024
验证码的攻防战:AI与人类的无休止斗争
在现代网络安全领域,验证码已成为防止自动化攻击的重要工具。然而,随着人工智能(AI)技术的进步,传统验证码的有效性正受到挑战。当前,神经网络和机器学习算法使AI能够学习和适应,轻松绕过传统的验证码。一
- Tue Aug 20 2024
世界模型又近了?MIT惊人研究:LLM已模拟现实世界
随着科技的不断进步,语言模型(LLM)正在逐步接近模拟现实世界。MIT的一项惊人研究显示,LLM不仅学习了表面的统计数据,还深入学习了包括空间和时间等基本维度的世界模型。这一发现为AI解决方案和大型语
- Tue Aug 20 2024
MIT惊人研究:LLM已模拟现实世界
随着科技的不断进步,语言模型正在逐步接近模拟现实世界。MIT的一项惊人研究显示,LLM不仅学习了表面的统计数据,还深入学习了包括空间和时间等基本维度的世界模型。这一发现为AI解决方案和大型语言模型开发
- Wed Aug 14 2024
Mamba再次挑战霸主Transformer,首个通用Mamba开源大模型一鸣惊人
近日,阿布扎比支持的技术创新研究所(TII)发布了全球首个通用Mamba架构的大型开源模型——Falcon Mamba 7B。这是继Falcon 180B、Falcon 40B和Falcon 2之后,
- Tue Aug 13 2024
首个支持普通话和方言混说的TTS大模型:支持河南话、上海话、粤语
自2024年GPT-4o出现以来,AI解决方案领域迅速迎来了热潮,各大公司纷纷投入大量资源研发TTS大模型。近期,中文语音合成大模型如chattts、seedtts、cosyvoice等层出不穷。虽然
- Mon Aug 12 2024
1890美元训出11.6亿参数高质量文生图模型
近日,来自加州大学尔湾分校等研究机构的团队取得了一项突破性进展:他们通过极大降低模型训练成本,实现了从头开始训练拥有11.6亿参数的扩散模型,仅需1890美元。这一成本优化方案不仅给予普通人接触预训练
- Fri Aug 09 2024
Figure 02机器人发布:微软、OpenAI、英伟达与英特尔联手打造最强人形机器人
8月6日,由微软、OpenAI、英伟达和英特尔联合投资的明星机器人创企Figure发布了新一代机器人Figure 02。这一更新再次颠覆了人们对人形机器人的想象,展示了AI解决方案领域的最新成果。Fi
- Thu Aug 08 2024
CogVideoX-2B开源:单张4090即可运行,优化推理至18G显存
8月6日,智谱AI正式宣布其视频生成模型CogVideoX-2B开源。这一消息引发了业内广泛关注。该模型已经在GitHub和Hugging Face平台上线,FP16精度下的推理仅需18GB显存,微调
- Wed Aug 07 2024
OpenAI联合创始人离职、总裁停工休假
近期,AI界迎来了一系列重大人事变动。8月5日,OpenAI联合创始人之一约翰·舒尔曼(John Schulman)在社交媒体上宣布离职,他将跳槽至由前OpenAI研究人员创立的公司Anthropic
- Tue Aug 06 2024
AI办公神器,打工人、学生党的效率救星
办公小浣熊是商汤科技推出的一款全新大模型AI原生工具,不仅完全免费,还提供了网页端和移动端小程序两种使用入口。用户可以通过自然语言对话实现数据分析,操作便捷,适用于各种AI解决方案需求。
- Mon Aug 05 2024
Stable Diffusion原班人马宣布推出全新的图像生成模型FLUX.1
由Stable Diffusion原班人马推出的全新图像生成模型——FLUX.1正式亮相。作为先进的AI解决方案,FLUX.1在文字生成、复杂指令遵循和人手生成方面展示了强大的技术优势。其专业版模型F
- Thu Aug 01 2024
GPT-4o语音功能终于如期而至,科幻版Her走进现实
在7月底,GPT-4o语音模式终于开启了灰度测试,一部分ChatGPT Plus用户已经抢先体验了这一革新功能。ChatGPT开发团队表示,高级语音模式提供了更加自然、实时的对话体验,用户可以随意打断
- Wed Jul 31 2024
AI生图玩法猛猛上新,豆包大模型新升级
在2024火山引擎AI创新巡展成都站活动上,豆包大模型团队隆重公布了最新进展,包含文生图模型和语音模型等多个垂直模型的新升级。这一活动吸引了众多AI从业者和企业的关注,展现了豆包大模型在AI解决方案和
- Tue Jul 30 2024
机器学习之父Mitchell :AI 如何加速科学发展,如何抓住机遇
近日,卡内基梅隆大学教授、有着机器学习之父之称的Tom M. Mitchell撰写了一份新的《AI for Science》白皮书,探讨了AI解决方案如何加速科学发展,以及美国政府如何抓住这一机遇进行
- Mon Jul 29 2024
生成一周大气模拟仅需9.2秒,谷歌气候模型登Nature
谷歌于7月23日在《Nature》发表了一篇具有里程碑意义的论文,介绍了与欧洲中期天气预报中心(ECMWF)合作开发的NeuralGCM大气模型。该模型结合了传统的基于物理建模的气象模型与先进的机器学
- Fri Jul 26 2024
字节大模型同传智能体,媲美人类同声传译水平
来自字节跳动 ByteDance Research 团队的研究人员推出了一款革命性的端到端同声传译智能体:Cross Language Agent - Simultaneous Interpretat
- Thu Jul 25 2024
Mistral AI开源Large 2,123B媲美Llama 405B
Mistral AI近日发布了其旗舰开源模型的最新版本——Mistral Large 2。该模型拥有1230亿个参数,在代码生成、数学计算和逻辑推理等方面表现优异,堪比OpenAI和Meta的尖端模型
- Wed Jul 24 2024
最强模型Llama 3.1 405B正式发布,开源引领新时代
Meta公司正式发布了开源AI领域的重磅模型——Llama 3.1 405B。这款顶级AI模型不仅在开源界独树一帜,其性能更可与最好的闭源模型相媲美。
- Tue Jul 23 2024
谷歌Gemini将亮相巴黎,为AI观赛体验开创新纪元
谷歌将通过其AI解决方案参与到2024年巴黎奥运会的转播中,以提供前所未有的观赛体验。据NBCUniversal和美国奥林匹克与残奥委员会(USOPC)透露,谷歌将利用AI定制开发技术,实现AI解说和
- Mon Jul 22 2024
全球微软蓝屏事件重创多个行业:CrowdStrike安全更新引发大规模停摆
上周五下午,由于一次网络安全巨头CrowdStrike的安全软件更新,全球多个行业遭遇了前所未有的停摆。此次事件导致了Windows操作系统的集体蓝屏,严重影响了大批金融机构、电视广播公司、医疗机构以
- Fri Jul 19 2024
小冰AI数字员工全面升级:零样本定制实现即时上岗
小冰公司最新推出的AI解决方案取得了重大突破,推出了“零样本”数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术。这种创新的技术依托超千亿大模型基座,
- Thu Jul 18 2024
AI技术浪潮中的行业变革与挑战:配音行业面临的机遇与风险
AI技术的发展正以惊人的速度改变各行各业。在这股浪潮的影响下,包括媒体和电台在内的许多角色已经开始被廉价的AI解决方案所取代。AI定制开发在视频制作领域的应用已经不再局限于二次创作。凭借近年来大量生成
- Thu Jul 18 2024
美国人工智能政策:特朗普政府的未来规划与硅谷支持
最近,据外媒报道,前美国总统唐纳德·特朗普的盟友正在起草一项全面的人工智能(AI)行政命令。此项命令计划启动多个“曼哈顿项目”,以推进军事技术开发并审查现有的“不必要和繁琐的法规”。这一举措表明,特朗
- Tue Jul 16 2024
百度文心旗舰模型全线降价
百度智能云市场部总经理曹海涛指出,持续降低成本是每个企业都非常关注的问题。从长远来看,手机、电脑、汽车等产品价格的下降是行业进入深水区的重要推动力。只有在技术、产品和能力均强大的企业,才能在价格战中占
- Mon Jul 15 2024
AI伴侣机器人——老龄化的未来
ElliQ 通过AI定制开发,由以色列初创公司 Intuition Robotics 研发生产。它包含一个小型数字屏幕和一个台灯大小的独立设备。与苹果的 Siri 和亚马逊的 Alexa 不同,Ell
- Fri Jul 12 2024
PaintsUndo上线,一张图生成绘画全过程
AI解决方案和AI定制开发领域迎来了一款革新性工具——PaintsUndo。通过这个项目,用户只需输入一张静态图像,PaintsUndo即可自动生成整个绘画的全过程视频,从线稿到成品全部都有迹可循。
- Wed Jul 10 2024
三星新品发布会,AI功能对标苹果
在今天的三星新品发布会上,AI解决方案成为焦点话题,上百次被提及。从折叠屏手机、智能戒指、智能手表到耳机,几乎所有产品都以AI为核心。其中,AI写作功能已广泛应用于各类App,可以帮助用户重写邮件,并
- Tue Jul 09 2024
视频生成新王者「可灵AI」再次升级了
AI解决方案和AI定制开发领域再次迎来重大创新。自6月6日正式发布以来,快手旗下的可灵AI成为首个在海外AI圈引起广泛讨论的国产大模型,并经历了三次迭代升级。无论是从文本生成视频,到两周后的图像生成视
- Tue Jul 09 2024
超越Transformer和Mamba的新架构TTT诞生
斯坦福大学、UCSD、UC伯克利和Meta的研究团队联合推出了一种颠覆性的新架构TTT,革新了大型语言模型开发的技术路径。这一全新架构通过使用机器学习模型取代传统的RNN隐藏状态,实现了更高效的上下文
- Sun Jul 07 2024
第六届世界人工智能大会在上海举办
在第六届世界人工智能大会上,AI大模型与应用领域再次成为焦点。作为本届大会的亮点之一,商汤科技展示了其最新的可控人物视频生成大模型Vimi。这一创新技术突破了以往只能控制头部表情的限制,能够精准实现表
- Sun Jul 07 2024
达摩院发布一站式AI视频创作平台"寻光",打造全新AI工作流
达摩院近期发布了全新的一站式AI视频创作平台“寻光”,这款平台定位为PUGC(专业用户生成内容)一站式AI视频创作解决方案,旨在通过AI定制开发技术提升创作全流程的效率。无论是剧本创作、分镜图制作,还
- Fri Jul 05 2024
8人小团队半年仿出GPT-4o,还开源了
在当前大型语言模型开发领域,法国一个名为Kyutai的仅有8人的非营利性AI研究团队,通过半年时间成功仿制了GPT-4,并推出了名为Moshi的多模态AI模型。Moshi不仅实现了听、说、看的多模态功
- Thu Jul 04 2024
Meta 推出3D生成技术,60秒内生成3D模型
近日,Meta发布了最新的Meta 3D Gen 系统,该系统能够在不到一分钟的时间内直接从文本生成3D资产。这一突破性的技术支持基于物理的渲染 (PBR),并允许用户通过额外的文本输入对先前生成的3
- Wed Jul 03 2024
ML工程师一次微调7个模型,击败OpenAI GPT-4
模型微调是AI定制开发过程中不可或缺的一部分。它指的是在已经训练好的大型语言模型(LLM)基础上,使用特定的数据集进行进一步训练。通过这种方式,开发者可以用较小的数据集和较低的训练成本,获取显著的性能
- Wed Jul 03 2024
豆包MarsCode 重磅上线:为开发者提供革命性的AI编程助手
豆包MarsCode,国产大型语言模型开发的巅峰之作,正式上线。作为一款新一代的AI解决方案,它集成了AI定制开发和云端集成开发环境(Cloud IDE),带来了类似高配版Colab和Copilot的
- Tue Jul 02 2024
Gen-3 Alpha开放:创意AI的全新突破
Gen-3 Alpha终于向部分超级创意合作者开放了,比起上一代,Gen-3 Alpha在细节、一致性和运动表现方面有了显著改进。这一突破性的技术为AI解决方案和AI定制开发带来了全新的可能性,使其在
- Mon Jul 01 2024
Meta最新发布的LLM Compiler,实现77%自动调优效率
近日,Meta 发布了一项重要的人工智能突破——LLM Compiler。这是一个强大的开源模型,专为优化代码并彻底改变编译器设计而设计。有望显著提升开发者处理代码优化的方式,使其更快、更高效和更经济
- Mon Jul 01 2024
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败
几天前,菲尔兹奖得主、剑桥大学研究主任Timothy Gowers利用GPT-4解决动物过河难题。他提出了一个新的基准——废话比率(crapness ratio),即大型语言模型(LLM)给出的总答案
- Fri Jun 28 2024
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
近日,新加坡国立大学尤洋团队开发出了业内首个可以实时输出的基于 DiT 的视频生成方法,命名为Pyramid Attention Broadcast(PAB)。这一创新技术通过减少冗余注意力计算,实现
- Fri Jun 28 2024
谷歌最强开源模型Gemma 2发布
6月27日晚,谷歌发布了新一代最强开源模型——Gemma 2。Gemma 2提供了90亿(9B)和270亿(27B)两种参数规模,分别训练了13T和8T tokens,且都拥有8192上下文窗口,可在
- Thu Jun 27 2024
字节豆包语音合成成果Seed-TTS技术揭秘
字节跳动豆包大模型团队近日发布了一项新的语音生成大模型成果——Seed-TTS。这一模型生成的语音几乎与真人完全一致,甚至连发音瑕疵也能生成出来,在模仿人类说话的相似性和自然度方面表现出色。这一技术突
- Thu Jun 27 2024
自动驾驶理论新突破登Nature子刊
尽管自动驾驶汽车在真实道路上的测试已达数百万公里,但其仍无法有效处理多种关键的安全事件。这些安全事件的概率分布呈现长尾特征,被称为自动驾驶汽车安全性的长尾挑战。然而,目前学术界尚未对此问题进行正式定义
- Thu Jun 27 2024
旷视发布开源AI人像视频生成框架MegActor:自然逼真的表情和动作
日前,旷视科推出了一项新的开源AI人像视频生成框架——MegActor。基于该框架,用户只需输入一张静态的肖像图片和一段视频(例如演讲、表情包或rap),即可生成一段表情丰富、动作一致的AI人像视频。
- Wed Jun 26 2024
快手可灵:图生视频与视频续写功能创新
快手最新推出的可灵凭借其先进的图生视频和视频续写功能,着实在业界引起了不小的关注。这为大型语言模型开发和AI定制化开发提供了新思路。更值得一提的是,可灵的图生视频模型融入了强大的提示词融合技术,用户可
- Tue Jun 25 2024
麻省理工学院研究揭示语言与推理的独立性
近日,麻省理工学院(MIT)等机构在顶级学术期刊《自然》杂志发表了一篇文章,观察到人类大脑在生成和解析语言的过程中并不涉及形式化推理,提出推理并不需要语言作为媒介。失语症研究的证据表明,所有经过检验的
- Mon Jun 24 2024
最新AI社交平台Butterflies正式上线
在经过5个月的测试后,美国AI社交媒体创企Butterflies AI正式推出其平台Butterflies(蝴蝶)。这一平台类似于Instagram,但与传统社交媒体最大的不同之处在于,大部分帖子都是
- Sun Jun 23 2024
AI提升新高考填报志愿的效率
2023年的高考报志愿是一次前所未有的挑战,考生数量庞大且已进入“新高考”时代。数百万考生及家长面临更多选择和新的不确定性,这时AI定制开发的解决方案成为了他们的重要帮手。传统经验不再适用,新技术的采
- Thu Jun 20 2024
Claude 3.5 Sonnet:革命性的AI大模型
近期,AI领域迎来了新霸主,Anthropic发布了具有开创性意义的Claude 3.5 Sonnet模型。这一新款AI大模型不仅超越了OpenAI的GPT4o,更在多个领域展示了领先的性能。Clau
- Mon Jun 17 2024
全球首个全学科智适应教育AI解决方案发布
近日,松鼠Ai在上海隆重召开发布会,推出全新多模态智适应教育大模型,全面升级其AI定制开发的教育解决方案。本次发布会不仅展示了松鼠Ai在教育科技领域的重大突破,还推出了新款智适应教育硬件产品。这次革新
- Fri Jun 14 2024
Luma AI 发布 Dream Machine AI 模型:带来文生视频与图生视频的新标杆
6月13日消息,美国3D计算机视觉创业公司 Luma AI 最新发布了一个名为 Dream Machine 的AI模型。该模型具备强大的文生视频和图生视频功能,能够生成极为逼真的画面和丰富的人物表情。
- Thu Jun 13 2024
大模型竞争带来的AI新机遇:应用和原生创新大放异彩
经过一年多的大模型大战,关于生成式AI的讨论正逐渐从“比参数、跑得分、拼排名”转向“谁的模型更开放、推理成本更低、算力更便宜”。随着基础大模型赛道的竞争格局尘埃落定,更多的创新和价值创造正向应用层汇聚
- Tue Jun 11 2024
苹果全球开发者大会发布重磅生成式 AI 技术,带来全面智能升级
在北京时间6月11日凌晨举行的苹果全球开发者大会(WWDC)上,苹果公司在库比蒂诺的Apple Park 发布了一系列重磅产品和技术。这次大会的亮点包括覆盖全线产品的生成式 AI 技术,以及可以进行文
- Fri Jun 07 2024
Stability AI开源47秒音频生成模型
音频生成领域迎来新突破,Stability AI 正式宣布推出其开放模型 Stable Audio Open。该模型能够生成高质量的音频数据,为AI解决方案和AI定制开发提供了新的技术支持。与 Sta
- Thu Jun 06 2024
高通亮出AI PC软硬件全家桶,联手微软领跑苹果
在最近的台北国际电脑展(COMPUTEX)上,AI成为了各大科技巨头展示的焦点。各家公司的CEO纷纷亮相,与观众互动,AI PC无疑成为了传统PC领域的“新物种”。从英伟达、英特尔和AMD等传统x86
- Wed Jun 05 2024
Stable Diffusion:开启 AI 艺术创作新篇章
Stable Diffusion是一种基于深度学习的图像生成模型,它能够从零开始,创造出令人惊叹的数字艺术作品。与传统的图像编辑工具相比,Stable Diffusion能够通过理解文本描述,自动生成
- Wed Jun 05 2024
AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴
在当今频发的极端天气情况下,企业和政府都在寻找有效的解决方案,以应对不断变化的气候挑战。如何更准确地预测这些极端天气事件,并进行充分的准备,成为了关键问题。AI解决方案和AI定制开发在这一领域展现出了
- Tue Jun 04 2024
AI解决方案赋能教育,猿辅导引领行业前沿
近日,猿辅导旗下的飞象星球发布了一段关于大模型场景测试的视频。这个测试距离猿辅导的看云大模型正式备案仅15天,表明在AI解决方案开发中,找到一个对用户有价值且技术上可行的应用场景是最为关键的一步。猿辅
- Mon Jun 03 2024
昆仑万维开源Skywork-MoE大模型,AI解决方案再获突破
6月3日,开源大模型领域迎来了一则重要消息:昆仑万维宣布开源其最新的2千亿稀疏大模型Skywork-MoE。这一AI解决方案不仅性能强劲,还大幅降低了推理成本。
- Sat Jun 01 2024
AI结合CaRi-Heart技术提前10年预测心血管疾病风险
《柳叶刀》最近发表了一篇重磅医学研究,揭示了一项名为CaRi-Heart的技术,这项技术结合了AI视觉识别和预测算法,可以在没有明显症状时提前10年识别出重大心血管疾病的风险。这一发现对于AI解决方案
- Thu May 30 2024
Mistral发布突破性的22B代码模型,支持80+种编程语言
真正Open的AI公司Mistral再次引领行业,此次发布了其首款代码生成模型——Codestral。这一模型支持超过80种编程语言,并具有32K长上下文窗口。在基准测试中,Codestral表现出色
- Tue May 28 2024
源2.0-M32大幅提升模型算力效率及AI应用前景
在2024年5月28日,浪潮信息发布了基于MoE(Mixture of Experts)技术的源2.0-M32开源大模型。这项创新不仅全面开源,还支持免费商用,所有模型参数和代码均可免费下载使用。这一
- Mon May 27 2024
科大讯飞永久免费开放讯飞星火Lite API
近日,科大讯飞宣布其星火Lite API永久免费开放,并推出了低至0.21元/万tokens的星火Pro/Max API。这一系列新功能不仅在处理海量复杂信息方面表现出色,还旨在提供更准确、快速的答案
- Sat May 25 2024
AI能有效识别大多数癌症扩散患者
据物理学家组织网5月25日报道,美国科学家开发了一款新型的AI解决方案,通过分析磁共振成像(MRI)数据,能够准确检测手臂下淋巴结中的乳腺癌细胞。临床实验显示,这种AI工具能够正确识别出95%的癌症扩
- Thu May 23 2024
阿里云在五国新建数据中心
2024年5月23日,阿里云宣布将在全球五个国家投资新建数据中心。这些国家包括韩国、马来西亚、菲律宾、泰国和墨西哥。这些新建的数据中心将重点建设AI基础设施,推动阿里云全球布局的规模进一步扩大。特别值
- Wed May 22 2024
微软 Build 2024 开发者大会召开
在2024年5月22日,微软 Build 开发者大会在美国西雅图盛大召开,揭示了许多AI 解决方案和最新的技术革新。本次大会主要聚焦于生成式AI的新形态硬件和AI定制开发工具堆栈。以下是大会的核心内容
- Tue May 21 2024
微软发布Copilot+PC,AI性能革新全面提升
5月21日凌晨,微软发布了最新的Copilot+PC,这款被誉为Windows PC中的“全新物种”的设备,正式搭载了OpenAI最新的GPT-4o技术。Copilot+PC不仅仅是“Copilot加