新算法可以识别Twitter上的厌女症_FIC:CryptoVerificationCoin

澳大利亚昆士兰科技大学的研究人员开发了一种算法,可以检测Twitter上的不良信息。

该团队通过首先挖掘100万条推文来开发该系统。然后,他们通过在帖子中搜索三个辱骂关键字来完善数据集。

接下来,他们根据上下文和意图将剩下的5,000条推文归类为是否是女权主义者。然后将这些带标签的推文输入到机器学习分类器,该分类器使用样本创建自己的分类模型。

该系统使用深度学习算法来随着语言的发展调整其术语知识。在AI积累词汇量的同时,研究人员监控了语言的上下文和意图,以帮助算法区分滥用,嘲讽和“积极地使用攻击性术语”。

该研究的共同作者里奇·纳亚教授说:“以短语“回到厨房”为例,由于没有结构上的不平等,机器的字面解释可能会错过女性主义的含义。”

“但是从对构成辱骂或厌恶女性语言的理解来看,它可以被识别为不良女性性推文。”

纳亚克说,这使系统仅通过分析文本即可理解不同的上下文,而无需语气的帮助。

当我们的算法将“回到厨房”识别为厌恶女性时,我们感到非常高兴-它证明了上下文学习是有效的。

研究人员说,该模型能够以75%的准确度识别出错误的推文。还可以对其进行调整,以发现种族主义,同性恋恐惧症或虐待残疾人。

该团队现在希望社交媒体平台将其研究发展为滥用检测工具。

“目前,用户有责任举报他们收到的滥用行为,”Naya说。“我们希望我们的机器学习解决方案可以被社交媒体平台采用,以自动识别和报告该内容,以在线保护女性和其他用户群体。”

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:31ms0-4:130ms