TY - JOUR A2 - 阿里,肖卡特AU - 汗与Atif AU - 易卜拉欣,易卜拉欣AU - 乌丁,M.伊尔凡AU - 祖拜尔,AU穆罕默德 - 艾哈迈德·沙菲克AU - 铝菲尔多西,穆罕默德Dzulqarnain AU - Zaindin,马赞PY - 2020DA - 2020年5月22日TI - 论坛讨论机器学习法应答检测: - 4621196 VL - 2020 AB - 如今,数据涌向在线网络论坛,并且非常希望把大数据分析的SP中的应用巨大的数据量转化为切实可行的知识。在线网络论坛已经成为网络的一个组成部分,是知识的主要来源。人们利用这个平台发布自己的问题,并从其他论坛成员的答案。通常情况下,最初的职位(问题)得到不止一个回复的帖子(答案),因此很难为用户扫描所有的人都为最相关和最优质的答案。因此,如何自动提取最相关的答案在一个线程中的一个问题是一个重要问题。在这项研究中,我们把答案抽取的分类问题的任务。的回复后可以被分类为相关的,部分相关的,或不相关的初始讯息。为了找到这个问题的答复的相关性/相似性,同时使用词汇和nonlexical功能。 We proposed to use LinearSVC, a variant of support vector machine (SVM), for answer classification. Two selection techniques such as chi-square and univariate are employed to reduce the feature space size. The experimental results showed that LinearSVC classifier outperformed the other state-of-the-art classifiers in the context of classification accuracy for both Ubuntu and TripAdvisor (NYC) discussion forum datasets. SN - 1058-9244 UR - https://doi.org/10.1155/2020/4621196 DO - 10.1155/2020/4621196 JF - Scientific Programming PB - Hindawi KW - ER -