,美国麻省理工学院的研究团队近日发表论文指出,现有的第三方推特(Twitter)机器人账户自动检测工具并不准确,因为其数据集过于简单,缺乏泛用性。
此前有消息称,机器人账户过多是阻止马斯克收购推特的原因之一。推特当时声称其日活跃用户中有 5% 是机器人账户,但马斯克表示这个数字要比 5% 高得多。
推特有自己的机器人账户识别系统,但并未公开。因此,对于普通公众而言,第三方工具是较为可行的检测方法。这些第三方工具使用从推特收集的数据集和机器学习模型来检测机器人的可疑迹象,许多工具和模型已被用于研究社交媒体上的机器人活动,相关论文甚至已达数千篇。
这些论文中的大多数基准数据集都是在不同推文中收集的数据集合,其中许多都是在特定推文中收集的,每条都由人类手动标记为机器人或人类。然而这种经过专门训练的机器人检测模型在该专业领域表现出色,却并没有涵盖全部领域,并且严重依赖于特定数据,而不是机器人和人类之间的根本差异。
当这些模型在其他领域的数据集上进行测试时,它们的准确性很差,几乎与随机预测水平相当。同时,在许多数据集上,即使是相对简单的模型也与最先进的机器学习模型准确率相当。
换言之,在一个数据集上训练的模型不能推广到其他数据集,现有的机器人检测数据集由于数据收集简单而通用性较低。
最后,研究人员警告说,当使用现有的机器人检测数据集时,用户应该仔细考虑可能存在哪些类型的偏差。研究人员认为,一个根本的解决方案是推特等社交媒体本身就应该为研究人员提供丰富、可靠的数据以及高质量的真实标签。
IT之家附上论文地址:点此前往
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
感谢IT之家网友雨雪载途的线索投递! ,《女神异闻录5》衍生新作《女神异闻录5战略版》上线索尼PSStore美服商店并开启预约,标准版预售价59.99美元(IT之家备注:当前约431元人民币),豪华...
2023-06-24 11:42
感谢IT之家网友雨雪载途的线索投递! ,根据国外科技媒体SamMobile报道,三星明年年初推出的GalaxyS24系列手机内部代号为“Muse”。 Muse在希腊语中代表缪斯女神,具有思考、思索...
2023-06-24 11:40
感谢IT之家网友独立摄影师的线索投递! ,据IT之家网友反馈,尼康发布公告,表示Z8数码微单相机在极少数情况下,由于镜头无法旋转到锁定位置,因此无法在相机上安装镜头。尼康将免费维修客户的对象产品,并...
2023-06-24 11:26
,英特尔在今年3月份推出了NUC13Pro迷你主机,代号为ArenaCanyon。不久后,英特尔又推出了一款NUC13ProDeskEdition,代号为VividCanyon,采用了新的外观。 现...
2023-06-24 11:23
附属拟收购PTRetailKreatifAmerta全部已发行股本) 智通财经APP讯,佐丹奴国际发布公告,于2023年6月23日,买方(GI.PTSingaporePte.Limited及Gior...
2023-06-24 11:04