人工智能从数据中学习 主动学习:教人工智能寻求帮助,但标记这些数据需要时间和金钱。主动学习则颠覆了这一模式——它教会人工智能在不确定时寻求帮助 主动学习:教人工智能寻求帮助,从而减少浪费并加快结果。在本文中,我们将解释它的工作原理、它的重要性以及它已经在哪些方面发挥了作用 主动学习:教人工智能寻求帮助。
什么是主动学习?
人工智能很聪明,但说实话——它不会读心术。它会犯错 荷兰电子邮件清单,会困惑,有时甚至完全不知道自己在看什么。这时,主动学习就派上用场了。人工智能不会给所有数据贴标签,而是专注于最具挑战性或最有价值的数据。这不仅提高了人工智能的准确性,还能显著降低成本。
实施主动学习的策略
AI开发者使用多种策略来提高学习效率。一种是不确定性抽样,AI会标记不确定的情况并请求人工输入。另一种是委员会查询(QBC),多个AI模型会分析相同的数据。如果它们意见一致,那就没问题。如果不一致,则由人工做出最终决定。
人工智能不会平等对待所有数据 如果您遵循倾听受众并从您的,而是优先考虑那些最能提高其准确性的数据。这避免了在不太有意义的信息上浪费精力,并加速了学习。
现实生活中如何运作
科技公司像实习生在职学习一样积极引导人工智能。
当人工智能陷入困境时,谷歌的搜索引擎和图像识别会通过参考人类的反馈来改进结果。亚马逊的推荐系统通过人工监督而不是随机猜测来调整产品建议。当遇到意外路况时,特斯拉的自动驾驶人工智能会向真实驾驶员学习。微软的语音识别通过人工审核纠正误解而得到改进,提高了人工智能理解口音和语音模式的能力。
为什么标记数据如此昂贵?
人工智能需要大量带标签的数据才能有效学习 短信列表。识别一只猫并非仅仅靠几张图片就能做到——它需要成千上万张图片。语音识别也是如此,转录数小时的音频成本高昂。即使标记一张图片的成本仅为10美分,累积起来也相当可观。公司还会投资于质量控制,聘请多名专家来确保准确性,这进一步推高了成本。
错误会让情况变得更糟。如果自动驾驶AI没有接受足够多正确标记的停车标志的训练,可能会很危险。有些概念也很难标记——AI并不总是像人类一样看待世界,需要不断的人工纠正。标记速度慢、成本高,但对于AI的可靠运行至关重要。
挑战与局限性
主动学习是训练人工智能的好方法,但它并非灵丹妙药。它自身也存在一系列问题。首先,人工智能必须选择正确的数据进行学习,但有时它的选择很糟糕。如果它在同一类型的任务上持续挣扎,可能会陷入循环,不断寻求帮助,而不是真正取得进步。
如果从零开始,效果会不好——人工智能需要一点知识才能开始;否则,它甚至不知道什么值得学习。这在模式快速演变的领域尤其具有挑战性,因为过时的信息会导致错误的决策,需要人工智能不断适应新数据。此外,虽然主动学习从长远来看可以节省成本,但一开始的设置成本并不低。它也并非适用于所有类型的数据。
而且别忘了,人工智能在遇到困难时仍然需要人类介入,所以它并非完全独立。更糟糕的是,它一开始可能会比较慢——在它开始做出明智的选择之前,需要一段学习过程。
主动学习的未来
主动学习正在重塑人工智能,使其更具适应性、更高效。未来的人工智能系统将能够更好地识别自身的不足,并在犯错之前主动寻求人工输入。这将减少错误,提高预测准确性,并实现更可靠的自动化。
目前,主动学习主要用于标记图像和处理结构化文本。但很快,它将扩展到更复杂的领域,例如分析整本书、实时视频流或海量研究数据集。它也不会孤立地运作——它将与深度学习和强化学习协同工作,实现动态改进。
未来的人工智能不仅能识别单词,还能掌握讽刺、语气和情感,从而彻底改变聊天机器人、虚拟助手和人工智能驱动的心理健康工具。