
Image by Nokia621, from Wiki Commons
อีเมลจาก Meta เปิดเผยการทอร์เรนต์หนังสือเถื่อนเพื่อการฝึกฝน AI
อีเมลที่ถูกเปิดเผยล่าสุด ได้ปรากฏขึ้นเป็นสิ่งที่ผู้เขียนหนังสือเรียกว่า “หลักฐานที่ทำให้เสียหายที่สุด” ต่อ Meta ในคดีร้องทุกข์ลิขสิทธิ์ที่ยังคงดำเนินการอยู่ ดังที่รายงานครั้งแรกโดย Ars Technica.
รีบร้อนอยู่หรือ? นี่คือข้อมูลสำคัญที่คุณต้องรู้!
- Meta ดาวน์โหลดข้อมูลละเมิดลิขสิทธิ์จากห้องสมุดที่มีความมืดมนเช่น LibGen และ Z-Library จำนวน 81.7 เทระไบต์ผ่านทาง torrent.
- อีเมลภายในแสดงว่าพนักงาน Meta ได้แสดงความกังวลทางกฎหมายเกี่ยวกับการดาวน์โหลดและการส่งต่อข้อมูลที่ละเมิดลิขสิทธิ์ผ่านทาง torrent.
- มีข้อกล่าวหาว่า Meta ได้ซ่อนการดาวน์โหลดผ่านทาง torrent ด้วยการหลีกเลี่ยงเซิร์ฟเวอร์ของ Facebook และลดการส่งต่อข้อมูลที่ละเมิดลิขสิทธิ์ให้น้อยลง.
Ars Technica รายงานว่าผู้เขียนตั้งข้อกล่าวหาว่า Meta ได้ฝึก AI บนหนังสือที่ละเมิดลิขสิทธิ์อย่างผิดกฎหมาย และอีเมล์เปิดเผยความกังวลภายในเรื่องความถูกต้องตามกฎหมายของการดาวน์โหลดและการเผยแพร่วัสดุที่มีลิขสิทธิ์
เดือนที่ผ่านมา Meta ได้ยอมรับว่าได้ทำการดาวน์โหลดชุดข้อมูลที่มีความขัดแย้งที่รู้จักกันในชื่อ LibGen ซึ่งประกอบด้วยหนังสือที่ถูกละเมิดลิขสิทธิ์หลายสิบล้านเล่ม
อย่างไรก็ตาม รายละเอียดยังคงเป็นปริศนาจนกระทั่งอีเมลที่ไม่ได้ทำการปกปิดถูกเปิดเผยต่อสาธารณะ
ตามที่ได้ระบุในเอกสารฟ้องร้องของผู้เขียน ว่า Meta ได้ดาวน์โหลดข้อมูลอย่างน้อย 81.7 เทราไบต์จากหลายๆ ห้องสมุดเงาผ่านทางเว็บไซต์ Anna’s Archive ซึ่งรวมถึงข้อมูลอย่างน้อย 35.7 เทราไบต์จาก Z-Library และ LibGen นอกจากนี้ “Meta ก็เคยดาวน์โหลดข้อมูลจาก LibGen ทั้งหมด 80.6 เทราไบต์”
“ขนาดของแผนการดาวน์โหลดที่ Meta ทำผิดกฎหมายนั้นมหัศจรรย์” ตามที่ได้ระบุในเอกสารฟ้องร้องของผู้เขียน โดยระบุว่าแม้แต่ “การละเมิดข้อมูลที่เล็กน้อยยิ่งขึ้น—เพียง .008 เปอร์เซ็นต์ของจำนวนงานลิขสิทธิ์ที่ Meta ละเมิด—ได้ส่งผลให้ผู้พิพากษาอ้างอิงการกระทำดังกล่าวไปยังสำนักงานอัยการสหรัฐฯ สำหรับการสอบสวนอาญา”
Ars Technica ระบุว่า อีเมลล์ที่รั่วไหลออกมายังเปิดเผยความไม่สบายใจภายในของพนักงาน Meta ด้วย ในเดือนเมษายน 2023 วิศวกรวิจัย Nikolay Bashlykov เขียนว่า “การดาวน์โหลดภาพยนตร์ผ่านทางโทรเร้นท์จากแล็ปท็อปทางการเรา ไม่รู้สึกถูกต้อง” พร้อมแย้มยิ้มผ่านอิโมจิ.
เขาแสดงความกังวลเกี่ยวกับการใช้ IP ของ Meta “เพื่อโหลดเนื้อหาโจรสลัดผ่านทางโทรเร้นท์” จนถึงเดือนกันยายน 2023, Bashlykov หยุดการยิ้มแย้ม, และปรึกษากับทีมกฎหมายของ Meta และเตือนว่า “การใช้โทรเร้นท์อาจจะมีการ ‘seed’ ไฟล์—นั่นคือ การแบ่งปันเนื้อหาไปยังภายนอก, สิ่งนี้อาจจะไม่ถูกต้องตามกฎหมาย.”
แม้จะมีการเตือนเรื่องนี้ ผู้เขียนก็ยังกล่าวหาว่า Meta ยังคงดาวน์โหลดและปล่อยเนื้อหาที่ละเมิดลิขสิทธิ์ แม้แต่พยายามปกปิดกิจกรรมของตนเอง
Ars Technica รายงานว่า ข้อความภายใน แสดงว่า Meta หลีกเลี่ยงการใช้เซิร์ฟเวอร์ Facebook ในการดาวน์โหลดชุดข้อมูลเพื่อ “หลีกเลี่ยง” “ความเสี่ยง” ที่ใครสักคน “จะสามารถติดตามคืนไปยังผู้ปล่อย/ผู้ดาวน์โหลด” ดังที่นักวิจัย Frank Zhang ได้บรรยายไว้
ไมเคิล คลาร์ค ผู้บริหารฝ่าย Meta ได้ยอมรับในการให้การสำนวนว่า การตั้งค่าได้ถูกปรับเปลี่ยน “เพื่อให้มีการเพาะเมล็ดในปริมาณที่น้อยที่สุดเท่าที่จะเป็นไปได้”
ผู้เขียนยังอ้างว่า บุคลากรของ Meta ที่เกี่ยวข้องกับการตัดสินใจในเรื่องการสร้างทอเรนต์ต้องถูกสอบถามใหม่อีกครั้ง เนื่องจากหลักฐานใหม่ที่อ้างว่า “ขัดแย้งกับคำให้การสำนวนก่อนหน้า”
ตัวอย่างเช่น ในขณะที่ CEO ที่ชื่อ Mark Zuckerberg อ้างว่าไม่ได้มีส่วนร่วมในการใช้ LibGen สำหรับการฝึกฝน AI แต่ข้อความที่ไม่ได้ถูกแก้ไขแนะนำว่า “การตัดสินใจที่จะใช้ LibGen ได้เกิดขึ้น” หลังจาก “การพัฒนาสถานการณ์ไปยัง MZ”
อย่างไรก็ตาม รายงานจาก Ars Technica ระบุว่า Meta ยังคงอ้างว่าการฝึกฝน AI บน LibGen นั้นเป็น “การใช้งานที่เป็นธรรม” และได้ปฏิเสธการกระจายผลงานของผู้เขียนโดยไม่ถูกต้อง แต่การเปิดเผยเรื่องการใช้ torrent ทำให้การป้องกันของตนเองมีความซับซ้อนขึ้น ทำให้ผู้เขียนสามารถขยายข้ออ้างของการละเมิดลิขสิทธิ์โดยตรงได้ตามที่คดีกำลังดำเนินไป
บริษัท Meta ต้องเผชิญกับการตรวจสอบที่เพิ่มมากขึ้นเกี่ยวกับการจัดการวัสดุที่ได้รับลิขสิทธิ์ โดยที่ผู้เขียนมุ่งมั่นที่จะทำให้ยักษ์ใหญ่เทคโนโลยีรับผิดชอบสำหรับสิ่งที่พวกเขาอธิบายว่าเป็น “แผนการโหลดทอเร้นต์ที่ไม่ชอบธรรมอย่างมหึมา”
แสดงความคิดเห็น
ยกเลิก