复旦团队研发大模型“眸思” 助力视障者“看见”世界

复旦团队研发大模型“眸思”助力视障者“看见”世界“听见世界”App街道行走模式图。本文图片均为复旦大学供图2023年上半年,由复旦大学自然语言处理实验室开发的MOSS被称为中国版的GPT,仅用半年时间后,多模态模型“眸思”问世。“眸思”与MOSS同音,但和基于文本的MOSS不同,它能够理解并识别图片内容,致力于成为视障者的一双“眸”。设计使用概念图基于“眸思”的“听见世界”APP,为视障者日常生活需求量身打造设计三种模式。在街道行走模式下,“眸思”如一位忠实的向导,红绿灯、十字路口、障碍物……它将细致扫描道路情况,提示潜在风险,陪伴视障者安全通行“看不见”的漫漫长路。在自由问答模式下,“眸思”则是一位贴心的朋友,让视力障碍者走进博物馆、艺术馆、公园,帮助捕捉四周景象的每个细节,用声音构建丰富的生活场景,传递每一处日常之美。在寻物模式下,“眸思”将成为一名可靠的管家,被移动的手杖、最爱口味的牛奶……日常物件的寻觅过程变得轻松无压力。据研究团队透露,中国盲人数量有1700多万,也就是说,每一百人中就有一位。但为什么在大多数人的认知里极少在街上看到盲人?这是因为,面对大量不安全因素,他们难以独自跨出家门。复旦大学自然语言实验室张奇教授说,人工智能发展日新月异,科技应该要改变更多人的生活,希望“眸思”能够帮助视障人士走出家门,让他们可以尝试更多工作,为人生书写更多可能。”项目落地背后,是一支年轻的团队和开放的氛围,从本科生到博士生共25名复旦学子及桂韬等多位教师、专家的加入,才有了“眸思”接续“MOSS”的成功。张奇介绍,该项目的主导者实际上都是“初出茅庐”的学生们,在组内头脑风暴会上,年轻学子总能提出开创性想法,能够找到另辟蹊径的解决办法。自去年9月以来,为了更好地感受视障者的难处,团队成员同样模拟真实情境,蒙眼探索视障者“黑暗”世界,并邀请视障人士加入,进一步摸清真实而具体的需求。复旦大学研究团队今年上半年,团队将结合AR升级APP内的定位精度细化至亚米级别,下半年团队希望将“眸思”升级到基于视频的判断。更多模式也正在开发中,比如阅读模式服务盲人朋友点菜、读书等场景,解说模式承担无障碍电影解说员的工作等。在政府的支持下,团队计划与NGO组织、智算中心和硬件厂商等开展合作,致力于让视障者免费使用产品和相关服务。预计今年3月,“听见世界”APP将完成第一轮测试,并在中国一、二线城市和地区同步开启试点,根据算力部署情况进行推广。...PC版:https://www.cnbeta.com.tw/articles/soft/1422142.htm手机版:https://m.cnbeta.com.tw/view/1422142.htm

相关推荐

封面图片

2日获悉,在复旦大学自然语言处理实验室(FudanNLP)师生的努力下,基于多模态大模型“复旦・眸思”(MouSi)为视障者量身

2日获悉,在复旦大学自然语言处理实验室(FudanNLP)师生的努力下,基于多模态大模型“复旦・眸思”(MouSi)为视障者量身打造的“听见世界”APP上线,将成为视障人士的生活助手与智能管家。2023年上半年,复旦大学自然语言处理实验室发布了开发MOSS对话式大型语言模型,被称为中国版的GPT,仅用半年时间多模态模型“眸思”问世。据介绍,“眸思”和基于文本的MOSS不同,它能够理解并识别图片内容,致力于成为视障者的一双“眸”。(中新网)

封面图片

复旦团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测

复旦团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测据复旦大学自然语言处理实验室消息,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(https://moss.fastnlp.top/),邀公众参与内测。MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通,为国内学术界和产业界提供了重要经验,将助力大语言模型的进一步探索和应用。(上观新闻)Source:投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

复旦团队发布国内首个类 ChatGPT 模型 MOSS,邀公众参与内测

复旦团队发布国内首个类ChatGPT模型MOSS,邀公众参与内测昨日,记者从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型「MOSS」已由邱锡鹏教授团队发布至,邀公众参与内测。MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通,为国内学术界和产业界提供了重要经验,将助力大语言模型的进一步探索和应用。邱锡鹏表示:「尽管MOSS还有很大改善空间,但它的问世证明了在开发类ChatGPT产品的路上,国内科研团队有能力克服技术上的重要挑战。」MOSS研发项目得到了上海人工智能实验室的有力支持。后期,这项工作将通过开源方式和业界社区分享。——

封面图片

复旦大学开源国内首个类ChatGPT模型MOSS,支持插件增强

复旦大学开源国内首个类ChatGPT模型MOSS,支持插件增强4月21日消息,国内首个类ChatGPT模型MOSS已正式开源。该模型由复旦大学自然语言处理实验室开发,名字致敬于《流浪地球2》中的量子机器人MOSS。此前,在测试时曾发布在公开平台,但由于瞬间压力过大,导致服务器过载,学术团队也表示了道歉和承诺进一步优化。目前,MOSS模型已上线开源,相关代码、数据、模型参数已在Github和HuggingFace等平台开放,供科研人员下载。https://github.com/OpenLMLab/MOSShttps://moss.fastnlp.top/来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

复旦张嘉漪团队和华山医院毛颖陈亮团队揭示视皮层在时间信息预测中的重要作用

复旦张嘉漪团队和华山医院毛颖陈亮团队揭示视皮层在时间信息预测中的重要作用对环境中不同时间间隔出现的各种信号的感知和预测对动物的生存和演化意义重大。一个典型的例子是,要及时躲避天敌,动物必须有效地对不同的时间信号作出准确预测。复旦大学脑科学研究院/医学神经生物学国家重点实验室张嘉漪团队,与复旦大学附属华山医院毛颖和陈亮团队合作,最近在时间信息预测研究方面取得重要进展,揭示了视皮层编码时间预测信息的重要机制。PC版:https://www.cnbeta.com/articles/soft/1323635.htm手机版:https://m.cnbeta.com/view/1323635.htm

封面图片

复旦MOSS大模型开源了 Github和Hugging Face同时上线

复旦MOSS大模型开源了Github和HuggingFace同时上线MOSS支持中英双语,拥有多轮对话和使用多种插件双重能力,具备搜索引擎、文生图、计算器、方程求解的“技能点”。目前,MOSS在GitHub上已有2.3kStar,热度还在持续上涨中。那么,MOSS究竟开源了哪些项目,目前有哪些功能?一起来看看。会解方程,也能生成图片据了解,这次MOSS开源的是第三轮迭代版本,名叫MOSS003。当然,MOSS003也并非开源了全部模型,目前主要开放的是基座预训练模型,最终模型即将在近期开源:此前,MOSS已经经历了两版迭代,一版是公开邀请内测的MOSS002版本,另一版是内部测试版本OpenChat001。三月份大伙儿见证的“国内首个开放测试的ChatGPT”,正是MOSS002版本。最新这个版本展现的功能效果如何?MOSS团队放出了它多轮对话、解方程、写代码、生成图片和回答道德伦理等示例。这是多轮对话的展示效果,具备资料追根溯源的能力:这是做数学题的示例,包括鸡兔同笼问题:也包括生成图片功能:还有近期网友热议的AI道德性问题:当然,这波里面也不乏“砸场子”的网友。例如官方GitHub问答中,有网友很想了解它的中文能力和chatglm6b相比谁更好,下面有网友调侃:你是来砸场子的么?这也是因为此前团队在MOSS002公开测试时曾经表示过,MOSS的中文能力不算太好,这也与训练数据有关。除此之外,团队这次还开源了一部分训练数据。至于完整数据,复旦MOSS团队表示“近期会全部开源”。国内最先发布的ChatGPT产品MOSS取自于《流浪地球》里面那个拥有自我意识的AI。它由复旦自然语言处理实验室邱锡鹏团队研发,2月20日正式发布。当时国内一众大厂还在陆续高调官宣要造ChatGPT,谁都没想到它就这么一声不吭地杀了出来。所以尽管MOSS的参数量比ChatGPT小了一个量级,大家还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题,是因为缺乏一个好的行业生态。就拿ChatGPT来说,OpenAI公司只需专注做好模型,算力、数据和系统则交给其他公司。反观国内,很多公司在做大型语言模型时所有环节都需要自己做,每家的数据和算力也有限,结果是每家都做不大。在发展过程中,大型语言模型训练与在线推理成本过高也是一个重大问题。因此,他们一开始就考虑要把MOSS开源而不是商业化。有了这样一个基座,大家就不用重复开发底层技术,可以在上面接不同的细分领域。如今,虽晚了快一个月,MOSS也说到做到了。你试用过复旦MOSS开源模型了吗?效果如何?...PC版:https://www.cnbeta.com.tw/articles/soft/1356187.htm手机版:https://m.cnbeta.com.tw/view/1356187.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人