大模型日报2024-04-19-程序员宅基地

技术标签: 大模型日报  segmentfault  人工智能  AIGC  gpt  paddle  

大模型日报

 

2024-04-19

 

大模型资讯

 

  1. Meta AI发布开源语言模型透明度工具

 

  • 摘要: Meta AI推出了一款名为Large Language Model Transparency Tool (LLM-TT) 的开源交互式工具包,旨在分析基于Transformer的语言模型。该工具能够协助研究人员和开发者更好地理解和评估这些先进的语言处理系统。

 

  1. GPT-4在眼科护理场景中超越初级医生

 

  • 摘要: 剑桥大学领导的一项研究发现,大型语言模型GPT-4在眼科护理场景中的表现接近专业眼科医生的水平。这表明人工智能在医疗健康领域的应用潜力巨大,能够在某些方面辅助或部分替代专业医疗人员的工作。

 

  1. 人工智能领域的大型语言模型迅速进步

 

  • 摘要: 随着技术的快速发展,大型语言模型在短短18个月内取得了显著的进步。OpenAI发布的ChatGPT聊天机器人,曾经引起广泛关注的技术,现已迅速成为人工智能领域的常态。这一变化反映了人工智能技术更新换代的高速度。

 

  1. LoReFT:面向语言模型的参数高效微调技术

 

  • 摘要: 最新研究提出了LoReFT技术,这是一种参数高效的微调方法(PeFT),旨在通过只更新少量权重来适应大型语言模型。该方法能够在不牺牲性能的前提下,有效减少模型调整过程中所需的资源和时间。

 

  1. 韩国初创公司Upstage AI获7200万美元B轮融资,旨在为企业打造定制化大型语言模型

 

  • 摘要: 韩国初创企业Upstage AI在其B轮融资中成功筹集到7200万美元资金。该公司计划利用这笔资金开发专为企业定制的大型语言模型,以满足不同行业对智能语言处理技术的需求。这标志着人工智能领域的一个新的投资亮点,也显示出定制化大型语言模型的市场潜力。

 

  1. AI在眼病诊断准确性上超越医生

 

  • 摘要: 一项由某大学领导的研究表明,GPT-4在临床知识和推理技能方面正接近专业眼科医生的水平。这项研究显示,在准确评估眼部问题方面,AI已经能够胜过医生,预示着人工智能在医疗诊断领域的潜力和发展。

 

  1. Reka AI推出多模态语言模型,挑战谷歌Gemini

 

  • 摘要: Reka AI公司宣布,由一名新加坡人和一名印尼人共同创立的该公司最新推出的Reka Core多模态语言模型在视频处理方面超越了谷歌的Gemini Ultra。Reka AI的这一突破可能会在人工智能领域引起重大关注。

 

  1. AI2发布OLMo 1.7-7B更新,带来更广泛数据集和改进的训练方法

 

  • 摘要: AI2最近更新了其开源语言模型OLMo至1.7-7B版本,此次更新包括了新的Dolma 1.7数据集和一个两阶段的训练课程。这一更新旨在通过更大规模和多样性的数据集,以及更有效的训练策略,进一步提升模型的性能和泛化能力。

 

  1. LoRA技术:打造个性化的精细调校语言模型

 

  • 摘要: 最新消息指出,现在你可以利用LoRA技术自己构建一个精细调校的大型语言模型(LLM)。LoRA为那些已经体验过ChatGPT、Claude等先进语言模型的用户提供了一个新的选择。通过LoRA,用户可以根据自己的需求和偏好,打造专属的语言模型,开启个性化的人工智能体验。

 

  1. MIT工程师利用大型语言模型赋予家用机器人常识

 

  • 摘要: 麻省理工学院的工程师们利用大型语言模型的帮助,使家用机器人在出现错误后能够自我纠正并继续完成家务任务。这项技术的进步意味着机器人在执行任务时能够更加独立地处理突发状况,提高了它们的自主性和效率。

 

大模型产品

 

  1. Pullpo.io: Slack中的快速AI代码审查

 

  • 摘要: Pullpo.io通过AI加速代码审查,实现Slack与GitHub实时同步,帮助开发团队将代码审查时间从数天缩短到数小时。

 

  1. SpeedLegal:智能合同谈判助手

 

  • 摘要: SpeedLegal是一款AI工具,旨在帮助用户更好地理解和协商合同。它能迅速识别合同风险,用简单语言解释复杂法律术语,并提供个性化改进建议。

 

  1. Collato AI:智能会议记录助手

 

  • 摘要: Collato AI Notetaker能将会议记录、图片和音频转化为文档。注册免费账户,邀请[email protected]参加Google Meet,Collato将自动完成记录工作,让你专注于更重要的事情。

 

  1. superwhisper iOS版:智能语音转文本

 

  • 摘要: superwhisper为iOS用户提供精准的AI语音识别功能。无论是散步时记录想法、会议摘要还是快速口述邮件,该应用都能以用户的风格准确转写文本,提高沟通效率。

 

  1. Prompt Fuzzer:保护AI应用安全工具

 

  • 摘要: Prompt Fuzzer是一个开源工具,旨在评估并增强你的生成式AI(GenAI)应用的安全性。通过模拟动态LLM攻击,该工具对系统提示的安全性进行检查,并提供评估报告,帮助你改进并加固系统提示功能。

 

  1. Pic Copilot 2.0:电商AI设计利器

 

  • 摘要: Pic Copilot 2.0利用AI技术,为电商提供创新视觉营销解决方案。新版增加多项功能,让电商设计变得简单、有创意且高效。

 

  1. Cascadeur 2.0:AI动画编辑工具

 

  • 摘要: Cascadeur 2.0推出动画解烘焙功能,利用AI技术简化编辑过程。无论是动作捕捉数据、资产还是生成的动画,均能自动识别关键帧并优化插值。

 

  1. SermoAI:金融领域的语言助手

 

  • 摘要: SermoAI是一款AI驱动的助手,专为银行和金融科技公司设计,能够以客户的母语提供全面的客户支持。它基于银行业务查询进行特别训练,符合银行隐私法规,是现代化的AI银行文员。

 

  1. Zoom Workplace:AI驱动的协作平台

 

  • 摘要: Zoom Workplace是一个集通讯、员工参与、空间和生产力解决方案于一体的平台,融合了Zoom AI Companion功能,旨在重新定义团队合作方式。

 

  1. Tabula:AI加速的创业数据分析工具

 

  • 摘要: Tabula是一款AI驱动的数据分析工具,帮助初创企业集中数据管理并自动化生成报告。无需招聘数据工程师即可定制和扩展分析能力。

 

大模型论文

 

  1. VG4D:结合视觉语言模型的4D视频识别

 

  • 摘要: 本文提出了VG4D框架,将视觉语言模型(VLM)知识迁移到4D点云网络,通过对齐4D编码器与VLM的表示,学习共享视觉文本空间,改进了动态点云骨干网络,提升了动作识别性能。

 

  1. 基于LLMs的自动化代码修复研究

 

  • 摘要: 本研究深入探讨了大型语言模型(LLMs)在自动化程序修复(APR)中的应用。提出了Toggle框架,实现了从识别代码错误位置到修复的全流程,刷新了CodeXGLUE代码细化基准的最新记录。

 

  1. LLMTune:用大型语言模型加速数据库调优

 

  • 摘要: LLMTune是一个基于大型语言模型的数据库配置生成器,能为新工作负载产生初始高质量配置,显著加快优化器的调优过程。通过自动化数据生成框架训练,实验表明LLMTune在多种工作负载下有效性高,如TPC-H工作负载下加速比达到15.6倍。

 

  1. 分子图GNNs的可扩展性研究

 

  • 摘要: 本研究探讨了图神经网络(GNNs)的扩展行为,通过分析最大的2D分子图数据集,证实了模型和数据集规模增加对GNNs性能的显著提升,为药物发现领域奠定了基础。

 

  1. MoA:个性化图像生成的注意力混合

 

  • 摘要: 本文提出了一种新的个性化文本到图像扩散模型架构,名为混合注意力(MoA)。MoA通过两条注意力路径分配生成任务,实现了主题与上下文的更好解耦,并提供了优质的个性化图像创作能力。

 

  1. 量化大型语言模型的多语言性能

 

  • 摘要: 本文提出了LanguageRanker工具,旨在基准测试和排名大型语言模型(LLMs)在不同语言上的性能。研究发现LLMs在所有语言的性能排名大致相同,且与训练语料的比例强相关。

 

  1. IoT云系统压力测试的精简框架

 

  • 摘要: 本文提出了一个为IoT云系统压力测试而设计的精简模拟框架,通过开发IoTECS领域特定语言,实现了高效模拟大量IoT与边缘设备。实验证明,IoTECS生成的模拟器性能优越,节省时间与资源。

 

  1. 新型神经手语生成方法:选择与重排

 

  • 摘要: 本文提出了一种新颖的手语翻译方法“选择与重排”(S&R),通过分解为词汇选择和词序重排两步,利用非自回归解码,显著提高了翻译的准确度和速度,尤其在资源有限的情况下,实现了更有效的手语翻译模型。

 

  1. LLM融合:基于困惑度的测试时优化

 

  • 摘要: 本研究提出PackLLM方法,通过优化算法在测试时融合多个大型语言模型(LLMs),以最小化输入提示的困惑度,实现模型专业知识的有效结合,显著提升任务性能。

 

  1. 隐私权在CSS与AI研究中的嵌入

 

  • 摘要: 本文探讨了在计算社会科学、人工智能和数据科学研究中保护隐私的重要性,分析了隐私问题及研究者在研究设计、数据收集、分析和成果传播过程中应考虑的关键事项。

 

大模型开源项目

 

  1. binary-husky:多功能LLM交互接口

 

  • 摘要: binary-husky项目,旨在为GPT/GLM等大型语言模型提供易用交互界面,强化论文处理能力。支持模块化自定义功能,多语言代码解析,以及多模型并行查询,集成多种AI服务。

 

  1. Mini-Gemini官方实现

 

  • 摘要: dvlab-research的Github Trending AI项目,名为Mini-Gemini,是其官方实现代码。该项目使用Python语言编写,涉及深度学习和人工智能领域的最新研究。

 

  1. Anthropics项目:探索Claude用例

 

  • 摘要: Anthropics是一个Github上的AI趋势项目,包含了一系列Jupyter Notebook文件。这些笔记本展示了使用Claude的一些有趣且有效的方法。

 

  1. 1Panel-dev:AI知识库问答系统

 

  • 摘要: 1Panel-dev是一个开源的AI问答系统,基于LLM大语言模型,能够迅速集成至第三方服务,由1Panel官方提供,使用Python编写。

 

  1. 斯坦福Oval项目:智能知识整合

 

  • 摘要: 斯坦福Oval是一个由大型语言模型(LLM)驱动的知识整合系统,能自动研究特定话题并生成带引用的全面报告。项目使用HTML编写。

 

  1. OpenTalker:单图像语音驱动面部动画

 

  • 摘要: OpenTalker是一个CVPR 2023项目,名为SadTalker,旨在通过学习真实的3D动作系数,实现风格化音频驱动的单图像说话面部动画。该项目使用Python编写。

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_40262196/article/details/137979902

智能推荐

分布式光纤传感器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告_预计2026年中国分布式传感器市场规模有多大-程序员宅基地

文章浏览阅读3.2k次。本文研究全球与中国市场分布式光纤传感器的发展现状及未来发展趋势,分别从生产和消费的角度分析分布式光纤传感器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括:FISO TechnologiesBrugg KabelSensor HighwayOmnisensAFL GlobalQinetiQ GroupLockheed MartinOSENSA Innovati_预计2026年中国分布式传感器市场规模有多大

07_08 常用组合逻辑电路结构——为IC设计的延时估计铺垫_基4布斯算法代码-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏12次。常用组合逻辑电路结构——为IC设计的延时估计铺垫学习目的:估计模块间的delay,确保写的代码的timing 综合能给到多少HZ,以满足需求!_基4布斯算法代码

OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版-程序员宅基地

文章浏览阅读3.3k次,点赞3次,收藏5次。OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版

关于美国计算机奥赛USACO,你想知道的都在这_usaco可以多次提交吗-程序员宅基地

文章浏览阅读2.2k次。USACO自1992年举办,到目前为止已经举办了27届,目的是为了帮助美国信息学国家队选拔IOI的队员,目前逐渐发展为全球热门的线上赛事,成为美国大学申请条件下,含金量相当高的官方竞赛。USACO的比赛成绩可以助力计算机专业留学,越来越多的学生进入了康奈尔,麻省理工,普林斯顿,哈佛和耶鲁等大学,这些同学的共同点是他们都参加了美国计算机科学竞赛(USACO),并且取得过非常好的成绩。适合参赛人群USACO适合国内在读学生有意向申请美国大学的或者想锻炼自己编程能力的同学,高三学生也可以参加12月的第_usaco可以多次提交吗

MySQL存储过程和自定义函数_mysql自定义函数和存储过程-程序员宅基地

文章浏览阅读394次。1.1 存储程序1.2 创建存储过程1.3 创建自定义函数1.3.1 示例1.4 自定义函数和存储过程的区别1.5 变量的使用1.6 定义条件和处理程序1.6.1 定义条件1.6.1.1 示例1.6.2 定义处理程序1.6.2.1 示例1.7 光标的使用1.7.1 声明光标1.7.2 打开光标1.7.3 使用光标1.7.4 关闭光标1.8 流程控制的使用1.8.1 IF语句1.8.2 CASE语句1.8.3 LOOP语句1.8.4 LEAVE语句1.8.5 ITERATE语句1.8.6 REPEAT语句。_mysql自定义函数和存储过程

半导体基础知识与PN结_本征半导体电流为0-程序员宅基地

文章浏览阅读188次。半导体二极管——集成电路最小组成单元。_本征半导体电流为0

随便推点

【Unity3d Shader】水面和岩浆效果_unity 岩浆shader-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏18次。游戏水面特效实现方式太多。咱们这边介绍的是一最简单的UV动画(无顶点位移),整个mesh由4个顶点构成。实现了水面效果(左图),不动代码稍微修改下参数和贴图可以实现岩浆效果(右图)。有要思路是1,uv按时间去做正弦波移动2,在1的基础上加个凹凸图混合uv3,在1、2的基础上加个水流方向4,加上对雾效的支持,如没必要请自行删除雾效代码(把包含fog的几行代码删除)S..._unity 岩浆shader

广义线性模型——Logistic回归模型(1)_广义线性回归模型-程序员宅基地

文章浏览阅读5k次。广义线性模型是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。广义线性模型拟合的形式为:其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。但是,有时候我们要进行非正态因变量的分析,例如:(1)类别型.._广义线性回归模型

HTML+CSS大作业 环境网页设计与实现(垃圾分类) web前端开发技术 web课程设计 网页规划与设计_垃圾分类网页设计目标怎么写-程序员宅基地

文章浏览阅读69次。环境保护、 保护地球、 校园环保、垃圾分类、绿色家园、等网站的设计与制作。 总结了一些学生网页制作的经验:一般的网页需要融入以下知识点:div+css布局、浮动、定位、高级css、表格、表单及验证、js轮播图、音频 视频 Flash的应用、ul li、下拉导航栏、鼠标划过效果等知识点,网页的风格主题也很全面:如爱好、风景、校园、美食、动漫、游戏、咖啡、音乐、家乡、电影、名人、商城以及个人主页等主题,学生、新手可参考下方页面的布局和设计和HTML源码(有用点赞△) 一套A+的网_垃圾分类网页设计目标怎么写

C# .Net 发布后,把dll全部放在一个文件夹中,让软件目录更整洁_.net dll 全局目录-程序员宅基地

文章浏览阅读614次,点赞7次,收藏11次。之前找到一个修改 exe 中 DLL地址 的方法, 不太好使,虽然能正确启动, 但无法改变 exe 的工作目录,这就影响了.Net 中很多获取 exe 执行目录来拼接的地址 ( 相对路径 ),比如 wwwroot 和 代码中相对目录还有一些复制到目录的普通文件 等等,它们的地址都会指向原来 exe 的目录, 而不是自定义的 “lib” 目录,根本原因就是没有修改 exe 的工作目录这次来搞一个启动程序,把 .net 的所有东西都放在一个文件夹,在文件夹同级的目录制作一个 exe._.net dll 全局目录

BRIEF特征点描述算法_breif description calculation 特征点-程序员宅基地

文章浏览阅读1.5k次。本文为转载,原博客地址:http://blog.csdn.net/hujingshuang/article/details/46910259简介 BRIEF是2010年的一篇名为《BRIEF:Binary Robust Independent Elementary Features》的文章中提出,BRIEF是对已检测到的特征点进行描述,它是一种二进制编码的描述子,摈弃了利用区域灰度..._breif description calculation 特征点

房屋租赁管理系统的设计和实现,SpringBoot计算机毕业设计论文_基于spring boot的房屋租赁系统论文-程序员宅基地

文章浏览阅读4.1k次,点赞21次,收藏79次。本文是《基于SpringBoot的房屋租赁管理系统》的配套原创说明文档,可以给应届毕业生提供格式撰写参考,也可以给开发类似系统的朋友们提供功能业务设计思路。_基于spring boot的房屋租赁系统论文