
Image by Oberon Copeland, from Unsplash
บอท AI ทำให้เซิร์ฟเวอร์วิกิพีเดียล้มเหลว
มูลนิธิวิกิมีเดียมีความกังวลเกี่ยวกับการเพิ่มขึ้นอย่างรวดเร็วของความดันที่เซิร์ฟเวอร์ของพวกเขาเนื่องจากโรบอตอัตโนมัติที่กำลังแปลงข้อมูลเพื่อฝึกสอนโมเดลปัญญาประดิษฐ์.
รีบร้อน? นี่คือข้อเท็จจริงที่คุณต้องรู้:
- บอท AI กำลังดึงข้อมูลจากวิกิมีเดียที่ระดับสูงสุดที่เคยมีมา
- บอททำให้การใช้แบนด์วิดท์สื่อมัลติมีเดียเพิ่มขึ้น 50%
- 65% ของการจราจรที่มีค่าใช้จ่ายสูง ณ ปัจจุบันมาจากเครื่องค้นหา
มูลนิธิได้รายงานในโพสต์ล่าสุดว่า การจราจรจากเครื่องจักรที่สร้างขึ้นอย่างต่อเนื่องยังคงเติบโตอย่างไม่เคยมีมาก่อน ในขณะที่ผู้ใช้งานจริงๆ เป็นเพียงส่วนเล็กๆ ของการจราจรนี้เท่านั้น
“ตั้งแต่มกราคม พ.ศ. 2567 เราได้เห็นความกว้างของแบนด์วิดท์ที่ใช้สำหรับการดาวน์โหลดเนื้อหามัลติมีเดียเติบโตขึ้น 50%,” ตามที่โพสต์ระบุ
“การเพิ่มขึ้นนี้ไม่ได้มาจากผู้อ่านที่เป็นมนุษย์ แต่ส่วนใหญ่มาจากโปรแกรมอัตโนมัติที่ดึงข้อมูลจากแฟ้มภาพของ Wikimedia Commons ซึ่งเป็นภาพที่ได้รับใบอนุญาตเปิดให้เผยแพร่เพื่อนำภาพไปใช้กับโมเดล AI,” โพสต์เพิ่มเติม
บอทที่รู้จักกันในนาม “crawlers” ได้ขโมยข้อมูลจำนวนมากจากโครงการต่าง ๆ ของ Wikimedia ซึ่งรวมถึง Wikipedia และ Wikimedia Commons โดยไม่มีการให้เครดิตที่เหมาะสมหรือเครื่องมือการเข้าถึงอย่างเป็นทางการ กระบวนการนี้ทำให้ผู้ใช้ใหม่ ๆ ลำบากในการค้นพบ Wikimedia และทำให้ระบบทางเทคนิคของ Wikimedia ต้องเผชิญกับภาระที่มากเกินไป
ตัวอย่างเช่น โพสต์ที่ระบุว่าหน้า Wikipedia ของ Jimmy Carter ได้รับจำนวนการเข้าชมกว่า 2.8 ล้านครั้งในวันที่เขาสวรรคตในเดือนธันวาคม 2024 วิดีโอการโต้วาทีในปี 1980 ทำให้เกิดการเพิ่มขึ้นอย่างมากในการจราจรของเว็บไซต์ วิดีโอการโต้วาทีของเขาในปี 1980 ก็ทำให้การจราจรของเว็บไซต์เพิ่มขึ้นอย่างฉับพลัน Wikimedia จัดการกับสถานการณ์ได้ — แต่เพียงเล็กน้อย ปัญหาที่แท้จริงตามที่วิศวกรระบุคือการส่งผ่านข้อมูลจากบอทที่เกิดขึ้นอย่างต่อเนื่อง
“65% ของการจราจรที่แพงที่สุดของเรามาจากบอท,” มูลนิธิบริษัทกล่าว บอท “อ่านเนื้อหาเป็นจำนวนมาก” โดยเฉพาะหน้าที่ไม่ได้รับความนิยม ซึ่งทำให้เกิดการร้องขอที่แพงเกินต่อศูนย์ข้อมูลหลักของ Wikimedia.
ในขณะที่เนื้อหาของ Wikimedia มีให้ใช้ฟรี แต่เซิร์ฟเวอร์ของมันไม่ใช่ “เนื้อหาของเราฟรี แต่โครงสร้างพื้นฐานของเราไม่ใช่,” มูลนิธิบริษัทกล่าว ทีมงานดำเนินการพัฒนาวิธีการเพื่อส่งเสริม “การใช้โครงสร้างพื้นฐานอย่างมีความรับผิดชอบ” โดยยุยงให้นักพัฒนาใช้ API แทนการดึงข้อมูลจากทั้งเว็บไซต์.
ปัญหานี้ส่งผลกระทบต่อวิกิมีเดียและเว็บไซต์และผู้เผยแพร่อื่น ๆ จำนวนมาก แต่สำหรับแพลตฟอร์มความรู้เปิดที่ใหญ่ที่สุดในโลก ปัญหานี้กำลังคุกคามความเสถียรของบริการที่ล้าน ๆ คนพึ่งพา
แสดงความคิดเห็น
ยกเลิก