欢迎阅读OSCHINA编辑部出品的开源日报,每天更新一期。
Nemotron-4340B系列模型支持4K上下文窗口、50多种自然语言和40多种编程语言,训练数据截止到2023年6月。训练数据方面,英伟达采用了高达9万亿个token。其中,8万亿用于预训练,1万亿用于继续训练以提高质量。
值得一提的是,在模型对齐过程中,超过98%的数据都是合成的,这展示了这些模型在生成合成数据方面的有效性。
北大与快手AI团队提出的新框架VideoTetris,为复杂视频生成带来了革命性突破!通过这个框架,团队可以像拼俄罗斯方块一样,轻松组合各种细节,成功生成符合复杂指令的视频内容。
在复杂视频生成任务中,VideoTetris超过了商用模型如Pika和Gen-2。该框架不仅增强了现有模型的组合生成能力,还支持多指令、多场景变更的长视频生成。
VideoTetris首次定义了组合视频生成任务,包括两个子任务:1、跟随复杂组合指令的视频生成;2、递进的组合式多物体指令的长视频生成。目前,几乎所有开源和商用模型都未能生成正确的视频,而VideoTetris成功实现了这一目标。
Arm为何要和自己的最大客户高通对簿公堂,这场伤人伤己的七伤拳会带来怎样的影响?
1)希望LINUX的成功,可以在硬件领域重演。
2)开源芯片不是一个梦,会像开源软件一样,也可以在未来形成一片新的天地,而这片新的天地当中,一定会有中国人、中国社区的贡献。
3)(2002年)我把LINUX讲清楚需要1300多页,但把香山讲清楚需要1700页,可以想象香山项目的规模。4)不仅要从开源拿东西,更要回馈和贡献。5)自然语言描述会有歧义,但源代码是精准的,因此阅读开源代码是提高技术水平的最好途径,读代码的同时要多动手实验。6)希望香山可以成为RISC-VCPU设计的事实标准。RISC-V芯片是不是国产,我倒没有看得那么重,因为既然是开源项目,一开源出来这就属于全人类。我认为香山存在的意义并不局限于中国国内,而是全世界。7)过去香山只有源代码,但今天不仅有源代码,还有1700页的详细分析。1700页的文字已经远超源代码的数量,可以想象这里面倾注了毛老师很多自己的思想,自己一生在这个领域的积累。相信这本书对于整个CPU领域也将会留下历史的贡献。
-微博包云岗
在RAG应用开发中,评估生成的结果是否正确非常关键,如果我们想采用LLM作为评估方法(vs人工,Prometheus-2是个可以选择的开源LLM方案↓
它是完全开源的,比现有的任何其他开放模型+gpt-3.5-turbo都要好,并且接近gpt-4-turbo和ClaudeOpus。
-微博黄建同学
有人会说,为什么你卷价格就挣不到钱,别人卷价格就能够挣到钱?别人让利,你为什么就不得不让本?按理说,市场竞争,有能力在不降低质量甚至提高质量的基础上,通过技术创新把产品成本降下去,给消费者让利,来获得竞争优势,这本来无可厚非。但是事情往往并非如此。我们在卷价格的背后,看到的是极少数车企更多的不择手段。
-微博CyberEv_赛博
包括Qwen2、Llama-3系列、CommandR+、Yi-Large、Doubao-pro-4k、文心一言ERNIE-4.0-8K、moonshot-v1-32k,GLM-4等等(需注册)。
-微博蚁工厂
在苹果CEO蒂姆·库克看来,一个好的AI产品,“它必须理解你,并扎根于你的个人背景,比如你的日常生活、你的人际关系、你的交流等等。它超越了人工智能。它是个人智能。”
但在实现上述目标的路径上,苹果AI眼下仍面临规模效应侧的两大挑战。
表现在适配的终端硬件上,受限于内存和芯片,苹果AI只能跑在iPhone15Pro/15ProMax,以及配备了M1及以上芯片的Mac上。这意味着在苹果现有超22亿的设备保有量中,仅有一小部分才能体验到今年秋季到来的AI新功能。
更糟糕的是,苹果AI将分阶段陆续推送,秋季只有英文版本上线,这意味着作为iPhone全球主力市场的中国地区,可能要等到明年才有望体验到苹果的AI功能。
-微博周鸿祎
十年一台阶——2013年,武汉成为“中国软件名城”创建试点城市,截至去年,武汉软件业务收入规模已从创建前的300亿元规模跃增至3023.8亿元,尤其近两年增速位居14座“中国软件名城”之首。
以此次大会为契机,武汉正在加快推进以软件为关键要素的新型工业化发展和新质生产力培育,并亮出攀登目标:力争到2025年,全市软件业服务收入突破4500亿元,从远期看,软件信息业将发展成为武汉新的支柱产业。
缺龙头?从工业重镇的土壤里汲取养分。缺“块头”?在空间的拓展里量体裁衣。缺“种子”?在新赛道里播下希望。补齐短板、锻造长板,武汉一步一个脚印推动软件产业做大做强。
-长江日报
6月11日,当苹果在其2024全球开发者大会(WWDC)推出了一系列升级更新,尤其是宣布将与OpenAI合作——将后者的ChatGPT全面整合至苹果设备时,马斯克一口气连发多条推文,措辞严厉,指责苹果“出卖用户数据”,并表示如果苹果在操作系统层面整合OpenAI,那么苹果设备将在旗下公司被禁止使用。“这是不可接受的安全违规行为。”
-中国经营网
通过不断扩大和优化高质量的开源数据集,智源推动了人工智能技术的创新和发展,从这次大会围绕开源数据众多动作来看,智源是铁了心要把开源数据这件事“死磕”到底。
-时代投研
有数码博主爆料称,华为HarmonyOSNext也是系统级AI,是可以打通第三方应用的系统,与iOS18方向相似。
-手机中国
虽然英伟达在算力芯片上仍然具有绝对领先的地位,但AI芯片的竞争还是处在一片正在快速扩张的蓝海之中,随着AI应用越来越深入我们的生活,更加难以想象AI芯片市场的规模极限,其中留给AMD和英伟达的空间自然也足够大。英伟达尽管通过长期积累建立了强大的优势,但还有足够的市场需求等待AMD满足,这也是后者的机会所在。
-证券之星
国产大模型仍处在一个追赶的阶段,大模型在科技圈里非常火热,而普通用户感受可能并不明显,很重要的原因在于大模型的能力不够,国内市场在场景、应用方面的优势还未发挥出来,因此国产大模型未来依然要朝着“非常好用的水平”去努力前进。
-中国经营报
四家掌舵人讨论的话题相当广泛,既包括形而上学,也有看得见的商业落地。在AGI(人工通用智能)、ScalingLaw(标度律,在大模型领域是指描述系统随着规模的变化而发生的规律性变化的数学表达)等话题上,观点不一、时有交锋。而在关于价格战话题上,此前对价格战并不感冒的王小川,则首次表达了对大模型降价潮的支持。
-科创板日报
蔡崇信认为,阿里是全球少数几家既有自己的AI能力又有云计算业务的公司之一,这种结合有巨大的竞争优势。他举例表示,微软和OpenAI是两家独立的公司,现在建立了紧密的合作,但独立也意味着他们未来可能会分道扬镳,“所以微软实际上并没有自己的AI开发,他们基本上把它外包给了OpenAI。”
-第一财经
李开复“选择”了ToC,“在中国ToC短期更有机会,国外两者都有”。李开复说,在ToC领域,类似于PC时代和移动互联网时代,一个新技术、新平台的出现必然带来新应用的出现,大模型同样如此。但这些应用的出现一定是按部就班的,遵循着生产力工具、娱乐工具、搜索工具、电商工具、社交工具等阶梯式的普及规律。
-北京商报
ZIO是一个零依赖的Scala库,用于异步并发编程。
---END---
本文标题:开源日报|Arm为何手撕高通;武汉软件产业蓄势进发;HarmonyOSNext是系统级AI;iPhone16会杀死大模型APP吗?