นักจัดเก็บข้อมูลดิจิทัลทำงานเพื่อป้องกันข้อมูลสาธารณะจากการสูญหาย

Image by Bernard Goldbach, from Flickr

นักจัดเก็บข้อมูลดิจิทัลทำงานเพื่อป้องกันข้อมูลสาธารณะจากการสูญหาย

ระยะเวลาในการอ่าน: 1 นาที

  • Kiara Fabbri

    ถูกเขียนขึ้นโดย Kiara Fabbri นักข่าวมัลติมีเดีย

  • ทีมแปลภาษา

    แปลโดย ทีมแปลภาษา ทีมแปลภาษาและบริการแปลภาษา

มากกว่า 30 ปีที่ผ่านมา, เครื่องจักร Wayback ของ Internet Archive ได้รักษาเว็บไซต์ของรัฐบาลและชุดข้อมูลที่สำคัญสำหรับการวิจัย, ตามที่รายละเอียดในรายงานใหม่ๆ โดย Spectrum.

รีบร้อน? นี่คือข้อเท็จจริงที่รวดเร็ว:

  • เครื่องจักรเวย์แบ็ครักษาข้อมูลที่สำคัญของรัฐบาล ซึ่งเป็นวัสดุที่สำคัญสำหรับการวิจัยด้านวิทยาศาสตร์และวิศวกรรม
  • ในรอบประกาศนียบัตรครั้งที่สองของทรัมป์ มากกว่า 8,000 หน้าเว็บและฐานข้อมูลรัฐบาลหายไปจากการเข้าถึงของสาธารณะ
  • ห้องสมุดนวัตกรรมแล็บที่มหาวิทยาลัยฮาร์วาร์ดได้รักษาชุดข้อมูล 311,000 ชุดที่เป็นส่วนหนึ่งของคอลเลกชัน Data.gov ไว้เรียบร้อยแล้ว

บันทึกเหล่านี้ จากหน่วยงานอย่าง NASA และ National Science Foundation ให้ข้อมูลที่จำเป็นสำหรับนักวิทยาศาสตร์และวิศวกร หากข้อมูลเหล่านี้หายไป ความถูกต้องของการวิจัยและความแม่นยำทางประวัติศาสตร์จะตกอยู่ในความเสี่ยง ดังที่ Spectrum ได้สังเกตการณ์ไว้

การลบข้อมูลของรัฐบาลไม่ใช่เรื่องใหม่ หลังจากเหตุการณ์ 9/11, รัฐบาลของบุชได้ลบล้างข้อมูลเป็นล้านบายท์เพื่อเหตุผลด้านความปลอดภัย ในขณะที่รัฐบาลของโอบาม่าได้เลือกวิธีการที่แตกต่าง โดยเปิดตัว Data.gov ในปี 2009 เพื่อขยายการเข้าถึงของประชาชนดังที่ Spectrum รายงาน

ในระยะเวลาที่ทรัมป์ทำหน้าที่ครั้งแรก นักวิจัยที่ Environmental Data & Governance Initiative พบว่าเว็บไซต์ของรัฐบาลบางแห่งไม่สามารถเข้าถึงได้ และการอ้างถึง “การเปลี่ยนแปลงสภาพภูมิอากาศ” ถูกลบออกจากหน้าเว็บหลายๆ หน้า ดังที่ Spectrum กล่าว

ในรอบประเทศครั้งที่สองของทรัมป์ ความกังวลเรื่องการรักษาข้อมูลนั้นเพิ่มขึ้นอย่างรวดเร็ว ในเดือนกุมภาพันธ์ The New York Times ได้รายงานว่ามีการเอาหน้าเว็บและฐานข้อมูลของรัฐบาลมากกว่า 8,000 หน้าถูกลบออก

บางส่วนได้เริ่มปรากฎอีกครั้ง แต่ Grist พบว่ามีการเปลี่ยนแปลง รวมถึงการลบคำว่า “การเปลี่ยนแปลงสภาพภูมิอากาศ” และ “พลังงานสะอาด” ในวันที่ 11 กุมภาพันธ์ ความท้าทายทางกฎหมายตามมา ภาคศาลรัฐบาลสั่งให้คืนข้อมูลของ CDC และ FDA ตามที่รายงานโดย Spectrum.

เพื่อต่อสู้กับการสูญเสียนี้ ผู้จัดเก็บข้อมูลดิจิทัลได้ดำเนินการ. ห้องสมุดนวัตกรรมที่ สถาบันกฎหมายฮาร์วาร์ด ได้ทำการคัดลอกทั้งหมดของ Data.gov ที่มีขนาด 16 เทราไบต์ ซึ่งประกอบด้วยข้อมูลชุดมากกว่า 311,000 ชุด พวกเขาใช้การสอบถามอัตโนมัติผ่าน API เพื่อให้มันอัปเดตทุกวัน.

ผู้จัดเก็บข้อมูลมีบทบาทสำคัญในการคุ้มครองความรู้โดยรักษาบันทึกประวัติศาสตร์ไว้อย่างยาวนานเพื่อรุ่นอนาคต การสูญเสียข้อมูลที่สำคัญด้วยการขาดหายของพวกเขาจะส่งผลให้เกิดการเขียนบันทึกสาธารณะใหม่ ซึ่งจะจำกัดความเป็นไปได้ในการวิจัยในอนาคต.

คุณชอบบทความนี้ไหม?
โหวตให้คะแนนเลยสิ!
ฉันเกลียดมัน ฉันไม่ค่อยชอบเท่าไหร่ พอใช้ได้ ค่อนข้างดี รักเลย!

เราดีใจที่คุณชื่นชอบผลงานของเรา!

ในฐานะผู้อ่านผู้ทรงคุณค่า คุณช่วยให้คะแนนเราบน Trustpilot หน่อยได้ไหม? การให้คะแนนนั้นรวดเร็วและสำคัญกับเรามาก ขอบคุณสำหรับความร่วมมือ!

ให้คะแนนเราบน Trustpilot
0 ได้รับการโหวตให้คะแนนโดย 0 ผู้ใช้
ชื่อเรื่อง
ความคิดเห็น
ขอบคุณสำหรับคำแนะนำของคุณ
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

แสดงความคิดเห็น

Loader
Loader แสดงเพิ่มเติม...