首页 > 资讯 > 商业 > 正文
2022-06-15 05:45

日本人戴着人工智能训练所需的口罩

Photo/Illutration

由于对训练面部识别程序所需的大量图像的需求日益增长,一组包含1000张日本人戴口罩的面部照片的数据集突然大受欢迎。

一些企业使用基于人工智能的程序扫描人脸或物品,并检查它们是否在数据库中,为了利用这些企业激增的需求,库存照片网站的运营商正在提供打包的内容。

库存照片经常用于企业广告和媒体报道。当用户签订合同,在特定条件下使用发布在网站上的图片时,运营商就会向提供商支付费用。

库存照片越来越多地被用于训练人工智能识别人脸和物品,因为它们省去了为此采集大量样本图像的麻烦。

日本人的面部照片需求量很大

日本主要股票图片平台Pixta的运营商Pixta公司于2018年开始提供AI训练数据。面部照片在其客户中最受欢迎,主要是电机和相机制造商,以及大学和其他研究机构。

位于东京涩谷区的Pixta公司提供各种数据,用于训练基于人工智能的程序识别日本人的面孔。

机器学习应用中使用的人类图像中,白人占了很大一部分。这被指责为照片中识别肤色较深的人的系统越来越不准确的问题。

Pixta开始收到越来越多客户对其储存的日本人面部图像的询问,他们希望这些数据将有助于提高面部识别系统的准确性,以便在有很多日本人的地方使用。

2021年6月,该公司开始提供包含1000张日本人戴口罩的面部照片的数据集。同年,对其人工智能训练数据的问询量是去年的三倍。

随着新型冠状病毒感染症(covid - 19病毒)的扩散,制造企业不得不更新面部识别程序,在不获取口腔和周围信息的情况下,可以通过口罩识别人脸并识别个人。

制作人员发现,使用覆盖着面具或其他物品的人脸图像训练人工智能很方便。

“我们开始收到更多关于戴口罩的照片的咨询,所以我们开始把它们作为数据集提供,”Pixta负责客户服务的官员福本早aka说。“我们希望这项服务能帮助客户节省收集这些照片用于研究的时间和精力。”

为了创建数据集,Pixta官方会根据照片在发布到平台上时附加的标签来搜索照片,比如“面具”和“日本人”。

一个为机器学习应用程序编辑的图像数据集的价格为16.5万日元(1300美元),而一个未经编辑的图像包的价格为9.9万日元。据Pixta的一位官员说,一些客户一次购买超过10个数据集。

没有关于人工智能训练数据集使用的全球规则

总部位于西雅图的Getty Images Inc.运营着全球最大的图库平台,大约四年前也开始在日本和其他地方为机器学习应用提供数据集。

它已经向制造商、零售商和公共实体出售了数百万张图片的使用权。例如,在农业部门,人们非常需要成熟水果的照片,以便在收获或运输水果时利用这些图像快速评估水果的成熟程度。

该公司还曾向那些需要人工智能训练数据来开发面部识别系统的人提供数据集,但现在它不再这样做了。

与Pixta不同的是,Getty Images采取了谨慎的做法,因为目前还没有关于将此类数据用于机器学习目的的国际规则。

上传人物照片到图库网站的人需要事先获得模特发布许可,或者得到照片主体的同意才能发布这些照片。

Getty Images今年3月宣布,它引入了一种新的模型发布表单,以检查模型是否同意使用它们在照片中捕捉的生物特征数据,用于训练机器学习算法,以开发生物特征识别技术。

Getty Images的一名官员表示:“全球隐私法正在迅速演变,在许多司法管辖区,将生物识别数据用于AI/ML(机器学习)目的需要得到明确的同意。”“随着我们新模型的发布,我们将建立一个生物识别数据集,可以让客户在法律上相信,他们已经获得了同意。”

精通个人信息保护的律师Yoichiro Itakura说:“海外监管机构正在努力创建一个保护个人数据的法律框架,比如欧盟的《通用数据保护条例》。它(盖蒂图片社)可能认为,对其业务而言,获得模特的明确同意更安全。”

Pixta的目标客户主要是日本。

根据政府个人信息保护委员会的规定,日本的个人信息保护法规定,企业在向第三方提供包含模特个人数据的图片时,应告知照片中的主体。

但是法律并没有要求公司明确这样做的目的。

早稻田大学知识产权法教授上野达弘表示:“原则上,即使不拥有《著作权法》第三十条第四款规定的原作版权,也可以自由使用机器学习等信息分析内容。”

Pixta的一名公关官员表示:“我们会根据不断变化的趋势和其他公司的举动,定期审查我们的模型发布形式。”“我们将继续密切关注修订相关法律的动向,并采取适当的应对措施。”