รับทำการตลาด อัลกอริทึมเครื่องตรวจค้นข่าวเลียนแบบใช้งานได้ดีมากยิ่งกว่ามนุษย์

นักวิจัยจากมหาวิทยาลัยมิชิแกนที่ปรับปรุงระบบได้แสดงให้เห็นว่ามันเปรียบเทียบได้กับ รับทำการตลาด บางครั้งและดียิ่งกว่ามนุษย์ในการเจาะจงข่าวเลียนแบบได้อย่างถูกต้อง

ในการศึกษาเรียนรู้เมื่อเร็วๆนี้พบว่าสำเร็จรูปได้ถึง 76 เปอร์เซ็นต์ของเวลาเมื่อเทียบกับอัตราความสำเร็จของผู้คนที่ 70 เปอร์เซ็นต์ ยิ่งกว่านั้นกรรมวิธีการวิเคราะห์ภาษาศาสตร์ของพวกเขาสามารถใช้เพื่อกำหนดบทความข่าวปลอมที่ใหม่เกินความจำเป็นที่จะถูกลบล้างโดยการอ้างอิงผ่านกับข้อสรุปอื่นๆ

Rada Mihalcea, 
ศาสตราจารย์ทางวิทยาศาสตร์รวมทั้งวิศวกรรมของ U-M ที่อยู่เบื้องหน้าเบื้องหลังแผนการพูดว่าโซลูชันอัตโนมัติอาจเป็นเครื่องไม้เครื่องมือที่สำคัญสำหรับเว็บไซต์ที่กำลังอุตสาหะจัดแจงกับการจู่โจมของข่าวปลอมซึ่งมักสร้างขึ้นเพื่อสร้างการคลิกหรือเพื่อจัดการกับข้อคิดเห็นของ รับทำการตลาด สามัญชน

การจับข้อความสำคัญเรื่องเลียนแบบก่อนที่จะส่งผลจริงอาจเกิดเรื่องยากเนื่องจากว่าผู้เก็บรวมทั้งไซต์สื่อสังคมออนไลน์จำต้องอาศัยบรรณาธิการของคนเราซึ่งมักไม่สามารถที่จะติดตามข่าวคราวการไหลท่วม ยิ่งไปกว่านี้เทคนิคการหักล้างในปัจจุบันมักขึ้นกับการตรวจตราเรื่องจริงจากภายนอกซึ่งอาจเกิดเรื่องยากสำหรับเรื่องราวปัจจุบัน บ่อยมากเมื่อถึงเวลาที่เรื่องราวได้รับการรับรองแล้วว่าเป็นของเลียนแบบแล้วความย่ำแย่ที่เกิดขึ้นได้ปฏิบัติไปแล้ว

การวิเคราะห์ภาษาศาสตร์ใช้ รับทำการตลาด กรรมวิธีที่แตกต่างกันการวิเคราะห์คุณสมบัติเชิงจำนวนเช่นโครงสร้างทางไวยากรณ์การเลือกคำเครื่องหมายวรรคตอนและความสลับซับซ้อน ดำเนินการได้เร็วกว่ามนุษย์และสามารถใช้งานได้หลายชนิดข่าวต่างๆ

คุณสามารถจินตนาการปริมาณของแอพพลิเคชั่นอันนี้ถึงที่เหมาะด้านหน้าหรือด้านหลังของข่าวหรือไซต์สื่อสังคมออนไลน์” Mihalcea กล่าว มันสามารถให้ผู้ใช้ประเมินความน่าไว้วางใจของแต่ละเรื่องหรือไซต์ข่าวทั้งหมดทั้งปวงหรืออาจเป็นบรรทัดแรกของการคุ้มครองป้องกันในส่วนท้ายของไซต์ข่าวการตั้งค่าสถานะที่น่าสงสัยสำหรับเพื่อการพิจารณาเพิ่มอีกอัตราการบรรลุเป้าหมาย 76 เปอร์เซ็นต์ ใบขอบที่มีขนาดใหญ่ยุติธรรมของข้อบกพร่อง แต่ว่าก็ยังสามารถให้ข้อมูลเชิงลึกที่มีคุณค่าเมื่อมันใช้พร้อมกันไปกับมนุษย์. “

อั
ลกอริทึมภาษาศาสตร์ที่ใช้พินิจพิจารณา รับทำการตลาด คำพูดเป็นลายลักษณ์อักษรเป็นเรื่องปกติปกติในปัจจุบัน Mihalcea กล่าว ความท้าทายสำหรับเพื่อการสร้างเครื่องตรวจค้นข่าวปลอมไม่ใช่อยู่ในการสร้างอัลกอริทึมเอง แต่สำหรับการหาข้อมูลที่ถูกสำหรับการฝึกอบรมอัลกอริธึมนั้น


ข่าวเลียนแบบปรากฏขึ้นรวมทั้งหายไปอย่างรวดเร็วซึ่งทำให้ยากต่อการรวบรวม นอกเหนือจากนั้นยังมีหลายจำพวกที่ซับซ้อนมากยิ่งขึ้นขั้นตอนการเก็บรวบรวม ข่าวการเสียดสีดังเช่นว่าเป็นเรื่องง่ายที่จะเก็บรวบรวม รับทำการตลาด แต่การใช้การประชดรวมทั้งความไร้เหตุผลทำให้ไม่ค่อยมีคุณประโยชน์สำหรับการฝึกหัดอัลกอริทึมเพื่อตรวจหาข่าวปลอมซึ่งหมายถึงการคดโกง


คณะทำงานของ Mihalcea ได้สร้างข้อมูลของตนสร้างทีมงานออนไลน์แบบย้อนกลับซึ่งได้ตรวจทานเรื่องราวข่าวแท้ที่ปลอมแปลงไว้เป็นของปลอมแล้ว นี่คือกรรมวิธีสร้างข่าวปลอมที่แท้จริงสูงที่สุด Mihalcea กล่าวโดยบุคคลที่เขียนได้อย่างเร็วเพื่อแลกเปลี่ยนกับเงินรางวัล

ผู้เข้ารับการศึกษาเล่าเรียนซึ่งได้รับการเลือกเฟ้นด้วยความให้การช่วยเหลือของ Amazon Mechanical Turk ได้รับค่าตอบแทนให้เปลี่ยนแปลงเรื่องราวในข่าวสั้นให้เป็นข่าวที่คล้ายคลึงกัน แม้กระนั้นเป็นของปลอมเอาอย่างต้นแบบการเขียนข่าวของบทความ ในตอนท้ายของกระบวนการทีมงานวิจัยมีชุดข้อมูลจริง 500 เรื่องแล้วก็ข่าวสารปลอม

แล้วหลังจากนั้นพวกเขาก็นำข้อมูลใส่ รับทำการตลาด เหล่านี้ให้เป็นอัลกอริทึมที่ใช้สำหรับในการวิเคราะห์ภาษาศาสตร์โดยสอนตัวเองให้เห็นความต่างระหว่างข่าวสารจริงกับข่าวปลอม สุดท้ายทีมงานได้เปลี่ยนแปลงอัลกอริทึมเป็นชุดข้อมูลจริงแล้วก็ข่าวสารเลียนแบบที่ดึงมาจากเว็บไซต์โดยตรงโดยคิดเป็นอัตราการบรรลุผล 76 เปอร์เซ็นต์


เนื้อหาของระบบใหม่และก็ชุดข้อมูลที่กลุ่มใช้เพื่อการสร้างนั้นใช้ได้อย่างอิสระและก็ Mihalcea กล่าวว่าพวกเขาสามารถใช้เว็บข่าวหรือหน่วยงานอื่นๆเพื่อสร้างระบบตรวจค้นข่าวของตัวเองได้ คุณบอกว่าระบบในอนาคตบางทีอาจได้รับการยกย่องเพิ่มเติมอีกโดยการรวมเอาข้อมูลเมตาตัวอย่างเช่นลิงก์และก็ข้อคิดเห็นที่เกี่ยวโยงกับรายการข่าวออนไลน์ที่ระบุไว้

Facebook Comments