你上传的 Instagram 照片，正免费帮 Facebook 训练 AI 模型？ 04月24日更新

训练机器学习辨识图片中的物件，往往需要耗费人力、时间标注出名称、类别，才能让机器顺利训练。为打造出方便厉害的 AI 机器学习模型，Facebook 有一项超级秘密武器──35 亿张 Instagram 公开照片，以及无数 Hashtag。

Instagram 公开照片，成免费训练模型素材

如果你习惯在发文时替照片加上几个 Hashtag，那么你有可能在帮 Facebook 训练机器学习模型。

过去要训练机器学习辨识物件，必须耗费相当多人力，举例来说，如果希望电脑理解“马克杯”这个东西，人类必须先标出这个东西是“马克杯”，接着机器才能有依据学习，现在 Facebook 找到一个用少量人力就能训练机器学习的方法。

第二天开发者大会 F8，首席技术长迈克‧施罗普佛（Mike Schroepfer）表示，Facebook 研究人员与工程师，利用平台 35 亿张公开照片、超过 17,000 个 Hashtag 为基础，透过上百个 GPU 解析资料，来训练自家图片辨识模型，目前在 ImageNet（图像数据库）已可达 85.4% 准确度。

但过程中也面对不少挑战，施罗普佛谈到，许多用户常常用错标签，像是用户虽然在照片标记“花枝”，但其实是“鱿鱼”。另外，Facebook 也必须训练哪些 Hashtag 是同义词，并将具体描述的 Hashtag，排序优于其他同类型 Hashtag，最终变成一套“大规模 Hashtag 预测模组”，来训练图像辨识模组。

▲ Facebook 利用 Instagram 35 亿张公开照片，加上用户标注的 Hashtag，来训练机器学习模型。（Source：Facebook）

Hashtag 训练模型，会有隐私问题吗？

不过现阶段大家更关心的还是“隐私”问题，当用户发表一张 Instagram 照片时，可以清楚知道自己正在提供资料，训练深度学习模型吗？

Facebook 表示，图像资料只会用来辨别与 Hashtag 之间的关联性，使用的资料都是公开的，且就算照片本身没有标签，就算机器再怎么厉害，也无法辨识出照片中的物件。简单来说，在 Instagram 上传公开照片，不论用户是否愿意，都正为 Facebook 的深度学习技术做出贡献。

▲ 首席技术长施罗普佛表示，过程中也面临不少挑战，像是许多用户常常用错标签。（Source：Facebook）

但 Hashtag 仍是训练关键，如果用户不想自己的照片变成训练机器学习的素材，就不要在公开贴文加上 Hashtag。Facebook 强调，团队只会在公开的 Hashtag，撷取与图像有关的素材，不会从照片内容推断用户行为。

Facebook 建构训练机器模型的方法，比起辨识精准度本身更有趣，将庞大、杂乱的素材整理成整齐、有依据的资料，未来可以帮助用户更精准快速的搜寻资料，甚至用 AI 自动生成图片说明、协助审核平台内容。

Facebook is using your Instagram photos to train its image recognition AI
Facebook trained image recognition AI with billions of Instagram pics
Facebook is using billions of Instagram images to train artificial intelligence algorithms

（本文由数位时代授权转载；首图来源：pixabay）

你上传的 Instagram 照片，正免费帮 Facebook 训练 AI 模型？

Instagram 公开照片，成免费训练模型素材

Hashtag 训练模型，会有隐私问题吗？

热门推荐

日本尺度超大的综艺节目连主持人都大喊“玩这么大可以吗”

2015下半年DMM最强AV女优排名出炉波多野结衣排名仅第三

Facebook、MessengerApp发生大规模闪退故障现象请暂停更新（内有简易修复法）

科学家大乱斗，一起打爆爱因斯坦、霍金、达尔文、图灵、居里夫人与牛顿吧

最新内容

十年后全球锂电池产能高达 1.3TWh，亚太地区仍是生产重地

小脑其实并不小，研究：只有可丽饼厚，皱褶拉平长达 90 公分

全球最快！荣总团队 7 天就能找出新生儿听损原因

心诚镁结盟台耀、台新药！攻全球呼吸治疗药 CDMO 商机

高龄者打疫苗送 500 元内赠品！网传打三剂返台免隔离为假讯息

英国、香港疫情大爆发！没打疫苗致死率高 31 倍

重训比有氧运动更能改善睡眠品质

国光生技 2 月营收年增 2,489.91%，选株百分百预判 WHO 流感病毒株

聚焦电动车散热工程方案，高柏科技推出一条龙散热对策服务

废弃火箭应已撞向月球，NASA 绕月飞行器预计 3 月中进行成像

关于我们

新闻资讯

意见反馈

网站地图