Privacy Auditing of Large Language Models
作者: Ashwinee Panda, Xinyu Tang, Milad Nasr, Christopher A. Choquette-Choo, Prateek Mittal
研究方向: 隐私审计与大型语言模型
本文研究了大型语言模型(LLMs)的隐私审计问题,提出了一种新的方法来检测LLMs的隐私泄露。该方法通过设计更易被模型记住的“哨兵”数据,提高了隐私审计的准确性。
作者: Ashwinee Panda, Xinyu Tang, Milad Nasr, Christopher A. Choquette-Choo, Prateek Mittal
研究方向: 隐私审计与大型语言模型
本文研究了大型语言模型(LLMs)的隐私审计问题,提出了一种新的方法来检测LLMs的隐私泄露。该方法通过设计更易被模型记住的“哨兵”数据,提高了隐私审计的准确性。
作者: Cécile Boulard, Sruthi Viswanathan, Wanda Fey, Thierry Jacquin
研究方向: 人机交互,人工智能
本文研究了如何使非专家用户理解并配置AI系统。通过构建一个基于强化学习的cartpole游戏,并引入了“影响”这一人机交互技术,让非专家用户通过直接操作影响来控制cartpole的行为,从而实现与AI系统的交互。实验结果表明,非专家用户能够通过探索和学习,成功配置AI系统并达到目标。
作者: Christopher S. Yang, Sylvester J. Gates III, Dulara De Zoysa, Jaehoon Choe, Wolfgang Losert, Corey B. Hart
研究方向: 神经形态计算与人工神经网络
本研究通过构建包含神经元和星形胶质细胞(类似单元)的脉冲神经网络模型,探究星形胶质细胞对神经网络学习的影响,并分析不同比例的神经元和星形胶质细胞对学习率的影响。
作者: Sabeen Ahmed, Nathan Parker, Margaret Park, Evan W. Davis, Jennifer B. Permuth, Matthew B. Schabath, Yasin Yilmaz, Ghulam Rasool
研究方向: 癌症 cachexia 的早期检测和预测
该研究提出了一种基于多模态 AI 的癌症 cachexia 早期检测生物标志物,通过整合患者数据,包括人口统计学、疾病状态、实验室报告、影像学检查(CT 扫描)和临床记录,以提高癌症 cachexia 的预测准确性。
作者: Xiao Wang, Lu Dong, Sahana Rangasrinivasan, Ifeoma Nwogu, Srirangaraj Setlur, Venugopal Govindaraju
研究方向: 社交机器人编程与多智能体系统
AutoMisty是一个基于多智能体和大型语言模型(LLM)的框架,旨在通过自然语言指令实现Misty社交机器人的自动代码生成,使得非编程用户能够轻松定制机器人行为。
作者: Yan Wang, Shijie Zhao, Kai Chen, Kexin Zhang, Junlin Li, Li Zhang
研究方向: 图像超分辨率与生成式模型
本文提出了一种名为GenDR的图像超分辨率方法,旨在解决传统超分辨率方法在细节恢复上的不足。GenDR通过结合文本到图像(T2I)扩散模型和超分辨率(SR)任务的特点,实现了高质量的图像细节恢复。
作者: Viktor Dorfler, Giles Cuthbert
研究方向: 人工智能伦理
本文探讨了人工智能伦理问题,特别是人工智能缺乏道德能力的原因。作者通过对比人类思维和人工智能的差异性,如感官知识、理解和自我怀疑的能力,来阐述人工智能在道德决策上的局限性。文章还回顾了伦理学的历史和主要流派,以及道德心理学在道德决策中的作用。
作者: Tianyi Zhang, Weiming Zhi, Joshua Mangelson, Matthew Johnson-Roberson
研究方向: 计算机视觉、生成模型、水下环境模拟
本文研究如何利用深度学习技术生成逼真的水下地形场景,以解决现有生成模型在生成水下图像时缺乏真实感和多样性的问题。
作者: Yufei Li, John Nham, Ganesh Jawahar, Lei Shu, David Uthus, Yun-Hsuan Sung, Chengrun Yang, Itai Rolnick, Yi Qiao, Cong Liu
研究方向: 自然语言处理,文本重写,强化学习
本文提出了一种名为DR GENRÉ的通用文本重写模型,该模型能够处理事实性、风格和对话性重写任务。为了模拟现实世界的用户重写请求,作者构建了一个名为CHATREWRITE的对话重写数据集。同时,结合LONGFACT和REWRITELM数据集,形成了一个广泛的基准,用于训练和评估通用重写模型。DR GENRÉ利用目标导向的奖励模型和特定任务的加权,通过强化学习进行训练。
作者: Feng Gu, Zongxia Li, Carlos Rafael Colon, Benjamin Evans, Ishani Mondal, Jordan Lee Boyd-Graber
研究方向: 自然语言处理、事件标注、人工智能辅助标注
该研究探讨了大型语言模型(LLM)在事件标注中的应用,评估了LLM作为辅助工具的效果,并分析了其作为独立标注者的局限性。