小数据可以在AI中发挥重要作用
作者:访客发布时间:2023-05-12分类:科技网络浏览:104评论:0
给大家分享一篇关于互联网和手机的文章。相信很多朋友对互联网和手机还是不太了解,所以边肖也在网上搜集了一些关于手机和互联网的相关知识与大家分享。希望大家看完之后会喜欢。
如今,超过四分之三的大公司正在实施“数据饥饿”的人工智能计划——涉及神经网络或深度学习系统的项目,这些项目已经在巨大的数据仓库中进行了培训。然而,组织中许多最有价值的数据集非常小:以千字节或兆字节而不是兆字节为单位。因为这些数据缺乏大数据的quantITy和speed,所以通常会被忽略。它们在个人电脑和功能数据库中显得微不足道,与企业范围的信息技术创新计划无关。
然而,正如我们最近对医学编码员的实验所证明的那样,新兴的人工智能工具和技术,加上对人为因素的仔细关注,为通过使用小数据和转换过程来训练人工智能提供了新的可能性。
对于驱动AI或高级分析程序的每个大型数据集(具有10亿行和10亿行),典型的大型组织可能有1000个未使用的小型数据集。许多例子:新客户群的市场调查、会议记录、少于1000列和行的电子表格。在我们的实验中,它是由一组医学编码员添加到医学图表中的注释——成千上万个图表中的每一个都只有几十个注释。
医务人员将分析每个患者的病历,并将关于诊断、治疗和药物的复杂信息转换成字母数字代码。这些代码将提交给计费系统和健康保险公司进行支付和报销,并在患者护理中发挥至关重要的作用。
我们实验的编码员都是注册护士,习惯用AI系统寻求帮助。人工智能扫描了图表,确定了医疗条件和治疗之间的关系,并为给定的图表建议了正确的代码。
我们想看看有没有可能把负责图表精准一次性评估的编码员转化为可以通过医学知识丰富AI的AI培训师,从而提高系统在识别链接方面的性能。
在为期12周的实验中,我们了解到将小数据与AI相结合来创建和转换工作流需要密切关注人为因素。我们认为,实验中的三个以人为本的原则可以帮助组织开始自己的小数据计划:
平衡机器学习和人事领域的专业知识。已经开发了许多人工智能工具来用小数据训练人工智能。例如,用更少的镜头学习可以教会AI仅基于一个或几个示例而不是数千个图像来识别对象类别(人脸、猫、摩托车)。在零镜头学习中,AI可以准确预测机器训练数据中不存在的图像或物体的标签。换句话说,它可以正确识别以前从未见过的东西。转移涉及将从一个任务中获得的知识转移到新任务的研究中,例如,基于另一种类型的知识识别癌症亚型,这消除了机器对执行新任务所需的大量新数据的需求。
在我们的实验中,我们使用了一个俗称知识图谱的工具,它可以清晰地表达不同类型实体之间的各种关系:“药物a治疗条件b”、“治疗x缓解症状y”、“症状y与条件b有关”等等。它简洁地捕捉专家知识,并使其适合机器推理——例如,在处方药和治疗的情况下,存在特定疾病的可能性。
为了使编码人员能够将他们的知识传授给AI,我们开发了一个易于使用的界面,使他们能够查看图形数据库中有争议的链接。这些链接是那些同事在查看单个图表时不同意人工智能的链接——通过添加系统未知的链接或删除已经添加的链接。根据他们的专业知识,编码员可以直接验证、删除或添加链接,并为他们的决策提供依据,他们的编码同事稍后就能看到。此外,我们鼓励他们遵循自己的意愿,即使用谷歌(通常与WebMD结合使用)研究药物疾病链接,这超出了现有AI的慢速搜索工具的范围。
机器学习和人类专业知识的这种结合具有显著的倍增效应。编码器不仅评估单个图表,还增加了影响所有未来图表的医学知识。此外,由于AI承担了大部分的日常工作,它大大减少了对整个病历进行筛选的需要,这样编码员就可以专注于问题特别多的病例。同时,数据科学家也从繁琐、低价值的数据清洗、标准化和整理中解放出来。
关注人工输入的质量,而不是机器输出的数量。在现有系统中,编码员专注于大量单个图表的评估。随着时间的推移,人工智能从众多编码员添加或拒绝的链接积累中吸取了教训:一旦编码员反复提出人工智能不熟悉的药物和疾病的链接,数据科学家就会将其添加到图形数据库中。这种手动过程只是偶尔执行,部分原因是积累链接建议需要很长时间,并且依赖于对链接的定量支持,而不是医学专业知识。
本文就为大家讲解到这里。- 科技网络排行
- 最近发表
- 标签列表
-