萍聚社区-德国热线-德国实用信息网

 找回密码
 注册

微信登录

微信扫一扫,快速登录

查看: 88|回复: 0

AI领域:开源库泄露用户数据风险

[复制链接]
发表于 2024-4-19 06:24 | 显示全部楼层 |阅读模式
作者:大连市互联网协会
近日,一项严重的安全问题浮出水面,数千家公司下载的 Python 包索引(PyPI)被发现存在数据泄露问题,将敏感的客户信息传输至未知服务器。这一事件迫使开源库的维护者不得不采取紧急措施,暂停了新用户的注册,以遏制事态的进一步恶化。这种攻击被形象地描述为一种“多阶段攻击”,其手段是一种名为“拼写错误”(typosquatting)的方法。攻击者利用这种方式,通过在用户的浏览器中植入恶意代码,从而窃取加密钱包、敏感数据(如cookie、扩展数据等)以及其他重要凭据。据网络安全公司Phylum的追踪报告显示,攻击者通过上传与流行合法包名称极为相似的恶意包,从而实施了这次攻击。他们发布了67种“requests”的变体、38种“Matplotlib”的变体,以及其他数十种常用软件包的拼写错误变体。事实上,长期以来开源软件包库一直是恶意软件攻击的目标。无论是Python的 PyPI、JavaScript的Node包管理器,还是Ruby的 RubyGems,都曾经遭受过日益复杂的攻击。这一事件无疑给AI开发者敲响了警钟,他们越来越依赖的开源库正面临着严重的信任问题。
1. 这不是第一次
随着开源库在软件开发中扮演的角色日益重要,针对它们的攻击事件频发,恰好映射出其影响力与价值的不断提升。不断增加的攻击活动间接验证了开源库在现代软件生态系统中的核心地位及其广泛应用带来的战略意义。这并不是首次在PyPI中发现恶意代码。专家表示:“超过50%的恶意代码表现出多种恶意行为,其中信息窃取和命令执行尤为常见。一些新的攻击媒介和反检测技术也出现了。”根据这项研究,74.81%的恶意包通过源代码安装成功渗透到最终用户的项目中。这些恶意有效载荷采用了持久性机制,能够在系统重启后继续存活。PyPI管理员和Python社区正积极采取行动,以维护生态系统的安全。PyPI曾在2023年11月和12月期间暂停了新用户的注册。这些临时性的暂停措施使得 PyPI 团队能够对恶意包的涌入进行分类,并实施额外的安全措施。此外,PyPI 还采取了积极主动的举措,与其他库保持一致。现在,对于关键项目和包,注册表要求进行双因素身份验证,使得攻击者更难以劫持维护者的账户。同时,团队还加大了对改进恶意软件扫描功能的投入,以期能够快速识别并移除恶意软件包。专家建议,最终用户在使用pip等工具选择和安装软件包时需格外谨慎,并应验证软件包的来源和可信度,以确保系统安全。这些攻击对企业的影响不容小觑。2023年,恶意Python 软件包窃取了包括 AWS 凭证在内的敏感信息,并将其传输至可公开访问的终端节点。
2. AI研究人员越来越依赖开源库
开源库在AI研究领域的应用日益普遍和深入,反映出AI研究人员对其依赖性的不断增强。从对话式聊天机器人、自动驾驶汽车到天气预报和推荐系统,人工智能开发人员正在试验各种神经网络架构、超参数和其他功能,以适应边缘平台的硬件限制。可能性是无穷无尽的。为了应对日益增加的AI开发需求,一些流行的深度学习框架和软件库如Google 的TensorFlow和Facebook的 Caffe2、PyTorch、Torchcraft AI和Hydra等诞生了。根据 tatista的数据,到2023 年,AI业务运营的全球收入预计将达到108 亿美元,而全球自然语言处理(NLP)市场规模预计将2025年达到433亿美元。随着企业对人工智能的采用日益增加,未来对开源库和架构的需求也将持续增长。在计算机科学中,库是指由预编译的、可重用的资源(如文件、函数、脚本、例程等)组成的集合,程序员可以在软件开发过程中引用这些资源。开源库是指具有开源许可证的库,这意味着软件可以被免费地重用、修改和/或发布,无需获得许可。开源库软件在计算机科学中的作用是为程序员提供一种更简单的方法来开发动态接口,通过存储易于访问和常用的例程和资源,如类、配置数据、文档、帮助数据、消息模板、预先编写的代码和子例程、类型规范和值等。这些预编译模块以对象格式存储,并组织得当,以便可以被多个独立的程序使用。开源库使用通用公共许可证,确保最终用户可以自由地运行、研究、共享和修改软件。
一些免费开源库软件的例子包括:开源JavaScript 库,如D3.js、jQuery和 Three.js;开源C库,如 Expat、GJS 和IUP;开源Python 库,如TensorFlow、Pandas和Matplotlib;Apache开源库,如 Datasketches 和 Commons;以及开源 C++ 库,如 KFR 和 Flac。

另一方面,像谷歌、Facebook和微软等公司在人工智能研究人员所使用的工具和深度学习框架方面占据主导地位。他们的许多开源库现在在 GitHub 上越来越受欢迎,GitHub 正在帮助全球新兴的 AI 开发人员构建灵活且可扩展的机器学习模型。

小资料:开源库的好处

开源库对计算机程序员非常有用,提供了对可重用的、预先编写的、常用的代码的访问,大大减少了工作量,程序员可以引用这些代码,而不是每次都从头开始编写所有内容。

    社区:开源解决方案由一个庞大、多样化和才华横溢的社区驱动,其共同目标是共同努力快速开发改进和解决问题。·

    成本:开源库和其他开源解决方案通过消除任何许可费用,降低部署解决方案的总体成本。

    可靠性:由于有一大群人审查开源库和软件,开源输出经过全面测试,并且往往非常健壮和可靠。

    安全性:让大量参与者参与开源解决方案的开发,增加发现和解决安全漏洞的机会。

    透明度:对代码库的完全可见性提供了透明度,使用户能够对他们将要使用的内容产生期望。

3. 猫捉老鼠的游戏
开源库的广泛应用使其日益受到青睐,因而也成为了黑客攻击的重要目标,不断提升安全防护措施的过程犹如一场持续不断的“猫捉老鼠”游戏。随着开源库越来越受欢迎,PyPI等开源库已成为寻求渗透软件供应链的攻击者越来越有吸引力的目标。其安全措施的演变一直是一场猫捉老鼠的游戏,攻击者不断完善策略,而PyPI管理员则努力保持领先一步。一方面,开源库一直在强化安全措施。在PyPI的早期,该存储库依赖于一个主要基于信任的模型,优先考虑为不断增长的Python社区提供便利性。多年来,最重要的一步是为PyPI帐户引入双因素身份验证(2FA)。双因素身份验证可以立即消除与密码泄露相关的风险。如果攻击者拥有某人的密码,则不足以让他们访问该帐户。PyPI还实施了其他措施,如用于更安全的包上传的API令牌和改进的恶意软件扫描工具。另一方面,各种攻击持续增加。Socket是一家为JavaScript、Python和Go依赖项提供供应链安全的公司,其创始人强调了问题的严重性,“在Socket,我们每周都会看到大约100次这样的攻击。”这些攻击对企业的影响可能很深远,如最近发生的恶意 Python 软件包窃取 AWS 凭证等敏感信息,并将其传输到可公开访问的终端节点的事件。不仅使公司面临风险,而且还使其客户面临潜在的安全漏洞和受损的软件版本。事实上,软件包的庞大数量和不断变化的威胁形势,意味着PyPI等开源库一直在“追赶中”。尽管面临挑战,Python社区等开源库社区近年来取得了重大进展。人工智能已经准备好接管数字世界,开源库允许开发者使用 ML 模型和工具以增强开发进度。因此,未来几年,没有理由怀疑开源库的发展前景,而安全措施正式人们忧虑的关键所在。小资料:7个顶级开源AI库在数字世界里,有7个特别出色的开源AI库,它们正推动着技术的进步。TensorFlow:Google推出的强大框架,适合机器学习和深度学习。它简单易用,能高效处理复杂的AI任务。无论是分类、理解还是预测,TensorFlow都能出色完成。Microsoft CNTK:微软的认知工具包,专为商业应用设计。它集成了各种深度学习技术,让AI应用更智能、更高效。苹果Core ML:苹果推出的AI库,让开发者能轻松在应用中集成机器学习模型。无论是单行代码还是高级神经网络,Core ML都能轻松应对。Keras Python:Python语言下的强大AI库,特别适合实验和繁重工作。它灵活、高效,支持各种深度学习技术,是开发者的首选之一。PyTorch:这个AI库性能卓越,可扩展性强。它支持自然语言处理等多种应用,让软件开发更加顺畅。Caffe:由Berkeley AI Research开发的C++库,以高速运行和创新架构著称。它特别适合图像分割和分类任务,是图像处理领域的佼佼者。Theano:一个由Python驱动的AI库,不仅能执行符号差异化和优化,还特别适合处理大型神经任务,因此在深度学习领域备受欢迎。得益于高端数学库NumPy的支持,Theano的运行速度远超其他库。Theano被誉为“基础库”,为深度学习Python编程带来了革命性的进步。尽管它通常用于广泛的科学计算,但同样适用于课堂教学。这些开源AI库各具特色,无论你是开发者还是研究者,都能在其中找到适合自己的工具,推动AI技术的进步。
本文源自:TMT产品技术


扫码关注大连市互联网协会开拓创新 服务网信

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

x
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

手机版|Archiver|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网 |网站地图

GMT+2, 2024-5-3 16:39 , Processed in 0.051467 second(s), 15 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表