Conversational AI

会话的人工智能

构建软件和系统，帮助人们自然地与计算机交流，就像与家人和朋友交流一样。

MinPrompt:基于图形的最小提示数据增强，用于少数几个问题的回答

臭死陈， Jyun-Yu江， Wei-Cheng常， Cho-Jui谢长廷， Hsiang-Fu余，魏王

ACL 2024

2024

最近在少镜头问答(QA)方面的进展主要依赖于预训练的大型语言模型(llm)的力量和特定设置的微调。虽然预训练阶段已经为llm提供了强大的推理能力，但llm仍然需要进行微调，以适应特定的领域，以达到最佳效果。在本文中，我们建议选择最具信息量的数据

会话的人工智能
交互式口语对话系统的有效的自我学习框架

语Tulsiani，陈伟民，莎莉尼·戈什， Garima Lalwani， Prabhat Pandey， Ankish邦萨尔，斯盖， Ariya Rastrow， Björn Hoffmeister

ICML 2024

2024

对话系统，如语音助手，有望与用户进行复杂的、不断发展的对话。不幸的是，在此类应用中部署的传统自动语音识别(ASR)系统通常被训练为独立识别每个回合，并且缺乏适应会话上下文或纳入用户反馈的能力。在这项工作中，我们介绍了一个总体框架

会话的人工智能
REPOFORMER:用于存储库级代码完成的选择性检索

Di吴， Wasi艾哈迈德， Dejiao张， Murali Krishna Ramanathan， (马

ICML 2024

2024

检索增强生成(retrieve -augmented generation, RAG)的最新进展开创了存储库级代码完成的新时代。然而，在现有方法中对检索的不变使用暴露了效率和鲁棒性方面的问题，大部分检索上下文被证明对代码语言模型(代码lm)没有帮助或有害。在本文中，我们提出了一个选择性的RAG框架来避免

会话的人工智能
MemoryLLM:面向可自我更新的大型语言模型

于王，一帆高，臭死陈， Haoming江，石羊李， Jingfeng杨，庆余阴，郑李，西安李， Bing阴，镜泊湖商，朱利安McAuley

ICML 2024

2024

现有的大型语言模型(llm)在部署后通常保持静态，这可能会使向模型注入新知识变得困难。我们的目标是建立包含相当一部分自更新参数的模型，使模型能够有效地集成新知识。为此，我们介绍MemoryLLM，这是一个由转换器和固定大小的内存池组成的模型

会话的人工智能
法学硕士置信度评分的多重校准

蒋禄卡Detommaso，马丁·伯特兰·洛佩兹，里卡多。Fogliato，亚伦罗斯

ICML 2024

2024

本文建议使用“多重校准”来为大型语言模型(llm)生成的输出产生可解释和可靠的置信度分数。多重校准要求的校准不仅仅是边际的，而是同时跨越各种相交的数据组。我们将展示如何为提示/完成对形成分组，这些分组与通过的正确性概率相关

会话的人工智能

加载更多

快速浏览亚马逊在naacl2024上发表的30多篇论文

特约撰稿人

2024年6月7日

尽管涉及大型语言模型的工作占主导地位，但经典和更通用的技术仍然有很好的代表。

会话的人工智能
快速浏览亚马逊在ICASSP 2024上发表的20多篇论文

特约撰稿人

2024年4月11日

今年的论文涉及的主题包括语音增强、口语理解、对话、副语言学和音高估计。

会话的人工智能
通过直接编辑网络层来更新大型语言模型

温和的苏

2024年3月25日

使用梯度识别突出层的自动化方法可以防止对先前看到的数据进行回归。

机器学习
新的预训练任务可以更好地理解文档

Srikar Appalaraju

2024年3月7日

DocFormerV2使使用本地特性的文档变得有意义，优于更大的模型。

计算机视觉
知识精馏方法用于更好的视觉语言模型

天洋赵，亚许辛格

2024年2月22日

该方法保留了教师模型的注意头编码的知识，即使学生模型的注意头较少。

计算机视觉
大型语言模型能理解世界吗?

马修·特雷格，斯特凡诺·索亚托

2024年2月15日

除了它的实际意义之外，最近关于“意义表征”的工作可能会揭示一些古老的哲学问题。

会话的人工智能

加载更多

会话的人工智能

出版物

相关内容

和我们一起工作