评分7.0

丹道至尊

导演:史蒂芬·斯皮尔伯格

年代:2014 

地区:西安 

类型:其他 法国 美国 法国 

主演:未知

更新时间:2024年11月18日 22:37

原标题:中国文化展示活动在摩洛哥举行

11月13日,彩云科技在北京总部与媒体进行一场主题为“From Paper to App”的沟通会。会上,彩云科技CEO袁行远,就通用大模型未来进化之路,与人工智能的落地场景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。

早在2017年,谷歌发布《Attention Is All You Need》论文,首次提出Transformer架构,掀开了人工智能自然语言处理(NLP)领域发展的全新篇章。Transformer架构作为神经网络学习中最重要的架构,成为后来席卷全球的一系列通用大模型如ChatGPT、Gemini的底层技术支撑。而提升Transformer的运行效率也成为人工智能领域的研究热点,2024年4月,谷歌最近一次更新了Transformer架构,提出了Mixture-of-Depths(MoD)方法,使得训练后采样过程中提速50%,成为Transformer架构提速升级的又一重要事件。

同样在今年,一家来自国内的人工智能企业彩云科技,在国际机器学习领域的顶级会议ICML(国际机器学习大会)上,发布全新大模型论文《Improving Transformers with Dynamically Composable Multi-Head Attention》。在该论文中,彩云科技团队首次发布DCFormer架构,并在基于DCFormer打造的模型DCPythia-6.9B上,实现了在预训练困惑度和下游任务评估上都优于开源Pythia-12B。这意味着,DCFormer模型在性能上,实现了对Transformer模型1.7-2倍的提升。

沟通会现场,袁行远首先向参会者展示了一个ChatGPT o1的问答:“假设ChatGPT4每天响应用户约2亿个请求,消耗超过50万千瓦时的电力。假设全球网络都使用ChatGPT作为访问入口,ChatGPT每天消耗多少电力?另外按照这个速度发展下去,到2050年全球人工智能的耗电量会达到目前地球发电能力的多少倍?”ChatGPT o1给出的答案是,“到2050年,全球人工智能的耗电量可能会达到目前地球发电能力的8倍”。

彩云科技团队构建DCFormer框架,提出可动态组合的多头注意力(DCMHA),替换Transformer核心组件多头注意力模块(MHA),解除了MHA注意力头的查找选择回路和变换回路的固定绑定,让它们可以根据输入动态组合,从根本上提升了模型的表达能力,由此实现了对Transformer架构1.7—2倍的性能提升。

袁行远表示:我们的工作表明,Transformer架构距离“理想模型架构”还有很大的提升空间,除了堆算力堆数据的“大力出奇迹”路线,模型架构创新同样大有可为。往小了说,在大模型领域,利用效率更高的模型架构,小公司也可以在与世界顶级人工智能企业的对抗中取得优势。往大了说,模型效率的提升,可以有效地降低人工智能升级迭代的成本,加速AI时代的到来。

“世界最强的小说续写通用模型。”沟通会上,袁行远向大家展示了首个基于DCFormer架构的通用大模型云锦天章。“这个成语是比喻文章极为高雅、华美,和我们的大模型想要实现的效果有共通之处。”袁行远介绍,云锦天章可以实现在虚构世界观的基础上,赋予小说人物编程、数学等基础能力,可以高速针对大量文字进行扩写、缩写,针对文章风格进行大容量更换,同时兼具其他模型的问答、数学、编程等基础能力。

而在应用端,拥有四百万用户的彩云小梦,也迎来了基于全新DCFormer架构的V.3.5版本。与之前的版本相比,彩云小梦V3.5整体流畅性和连贯性提升了20%,支持前文长度由2000字提升至10000字,故事背景设定最长长度高达10000字。“这意味着梦回唐朝电视剧全集,在故事创作或者与人工智能对话中,人工智能能够记住之前发生的事情,记住之前故事里发生的细节,人物记得自己明确的目标,并且会根据剧情及时进行反思修正。在做到自主创作的同时,发散性收敛,不会天马行空,人物性格前后一致,故事逻辑性更强。”

原标题:珠海驾车撞人致35死嫌犯被批捕

1.经检疫合格的菠萝,缅方应出具植物检疫证书,注明果园和包装厂名称或其注册号码,并在附加声明中注明:“This consignment complies with the requirements specified in the Protocol of Phytosanitary Requirements for Export of Fresh Pineapple Fruits from Myanmar to China, and is free from the quarantine pests of concern to China.”(该批货物符合缅甸鲜食菠萝输华植物检疫议定书要求,不带中方关注的检疫性有害生物。)

糖尿病患病人群庞大,但治疗达标率并不高。中国疾控中心官网2021年相关研究显示,中国糖尿病治疗率仅32.9%,接受治疗的患者中达标比例(控制率)为50.1%。也就是说,所有成人糖尿病患者中仅有16.5%的患者血糖有效控制。有专家曾指出,糖尿病治疗达标率低与治疗依从性(即病人按医嘱进行治疗)差等因素有关。

首先,胰岛素并不是2型糖尿病的一线治疗方案。糖尿病主要分为妊娠糖尿病、1型糖尿病和2型糖尿病三种类型,其中2型糖尿病占全球糖尿病病例的90%。根据中国2型糖尿病防治指南,2型糖尿病的一线治疗方案是生活方式干预和二甲双胍等口服药。医生通常会首先推荐生活方式的改变,包括饮食控制和增加体力活动,如果这些改变不足以控制血糖水平,医生会建议使用口服降糖药物,如二甲双胍,近年来还有口服新药出现。

但目前,大部分2型糖尿病患者存在胰岛素治疗起始晚、治疗依从性差等问题。有数据显示梦回唐朝电视剧全集,中国2型糖尿病患者平均起始基础胰岛素治疗的糖化血红蛋白已高达9.7%,这与指南推荐的该指标在7%以上就应该起始胰岛素治疗相距甚远。背后一个重要原因,是病人不愿意注射胰岛素,打针和吃药相比,人们总是更接受吃药梦回唐朝电视剧全集,因此这一定程度影响了患者血糖达标和长期治疗效果。

李小英:起始晚这里有几个因素。第一个因素,医生按照指南(中国2型糖尿病防治指南),首先是口服药二甲双胍,还有其他新的口服药,然后才到胰岛素。医生首先按照指南路径,总是先用口服药梦回唐朝电视剧全集,看血糖能不能控制,不能控制再加胰岛素。但这些年有一点变化,指南里胰岛素的位置逐渐前移,这也是一个现象,医生用药行为会受到指南和共识的影响。

李小英:大趋势是(年轻化)这样的。中国现在成人糖尿病患者达12.8%,60岁以上的糖尿病患者可以达到20%,这是年龄的关系。但还有一个现象,这个年龄结构在下移,原来很少见到30岁以下、20多岁的2型糖尿病患者,但现在开始出现了。30岁~40岁的比例增加了。可以看到整个发病的年龄阶段有一点提前,这是总体上的趋势。背后的原因,主要还是在儿童、青少年肥胖,肥胖是2型糖尿病主要的危险因素。

澎湃新闻:2023年您的团队在国际期刊《Nature Medicine》(自然医学)发表研究成果,首次提出采用基于强化学习算法的AI系统“RL-DITR”制定胰岛素决策策略,提升2型糖尿病患者的胰岛素治疗方案准确性。随着现在新药不断出现,这项研究和新药能不能结合起来应用在更多患者身上?   

血糖动态变化,通过一定的(药物、生活方式等)干预手段,是可以让患者的糖尿病得到“缓解”的。比如对肥胖者来说,其中一个最有效的办法就是减重,把体重管理好以后,糖尿病可以缓解。还有一些患者通过有效管理生活方式,从胰岛素治疗逐渐转为口服药治疗,再到逐渐停药,这种情况也是存在的。从这种意义上来说,糖尿病是可逆的。