เนื้อหานี้ได้รับการสนับสนุนโดย Arrow NetAppเมื่อพูดถึงข้อมูล เป็นเรื่องง่ายสำหรับผู้จัดการของรัฐบาลกลางที่จะจมอยู่กับโฆษณาเกินจริงและวางเกวียนไว้ข้างหน้าม้า ทุกคนต้องการเริ่มต้นใช้งาน AI การเรียนรู้ของเครื่อง และระบบอัตโนมัติของกระบวนการหุ่นยนต์โดยเร็วที่สุดเพื่อลดค่าใช้จ่ายและปลดปล่อยพนักงานจากงานที่ซ้ำซากจำเจ แต่หน่วยงานส่วนใหญ่เพิ่งเริ่มต้นด้วยการวางรากฐานที่จะทำให้เครื่องมือเหล่านั้นมีประโยชน์จริง และพื้นฐานนั้นคือกลยุทธ์ข้อมูล
“การเข้าถึงข้อมูลที่ไม่ดีจะทำให้เครื่องมือ AI ทุกตัวไร้ประโยชน์
คุณต้องใช้เวลาและความพยายามนั้นในการสร้างชุดข้อมูลมาตรฐานคุณภาพสูง” เคิร์ก เคิร์น ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของเน็ตแอพกล่าวระหว่างการอภิปรายเมื่อวันที่ 5 ธันวาคม “มีกระบวนการทำซ้ำๆ มากมายที่เกี่ยวข้องเมื่อคุณทำงานผ่านเทคโนโลยีเหล่านี้ นั่นคือจุดที่ฉันคิดว่ามีเทคโนโลยีที่น่าสนใจบางอย่างที่ช่วยในชั้นการจัดเก็บข้อมูลในชั้นข้อมูล ดังนั้นสิ่งที่ง่ายอย่างเช่นการจัดการข้อมูลการคัดลอกอาจมีประโยชน์อย่างยิ่งสำหรับนักวิเคราะห์หรือผู้ปฏิบัติงานด้าน AI”
ในการศึกษาล่าสุดที่เผยแพร่ในปี 2019 โดยบริษัท RAND เกี่ยวกับเทคโนโลยี AI ในกระทรวงกลาโหม ท่าทางของกระทรวงกลาโหมสำหรับปัญญาประดิษฐ์ได้ตอกย้ำประเด็นนี้ รายงานพบว่า “ความสำเร็จในการเรียนรู้เชิงลึกขึ้นอยู่กับความพร้อมใช้งานของชุดข้อมูลขนาดใหญ่และพลังการประมวลผลที่สำคัญในการฝึกอบรมแบบจำลอง” การทำให้ข้อมูลมีประโยชน์เป็นหนึ่งในเป้าหมายหลักของกลยุทธ์ข้อมูลของรัฐบาลกลางแบบใหม่ของ Office of Management and Budget ในความเป็นจริง หนึ่งในสององค์ประกอบหลักของกลยุทธ์นั้นเกี่ยวข้องกับการปฏิบัติ ซึ่งรวมถึงการช่วยให้หน่วยงานต่างๆ สามารถ:
รับรู้และได้รับประโยชน์จากคุณค่าของข้อมูลโดยการสร้างวัฒนธรรมที่ให้ความสำคัญกับข้อมูลและส่งเสริมการใช้งานสาธารณะควบคุมจัดการและปกป้องข้อมูล และ
ส่งเสริมการใช้ข้อมูลอย่างมีประสิทธิภาพและเหมาะสม
หน่วยงานของรัฐบาลกลางล้วนเริ่มต้นจากที่ต่างๆ ในความพยายามนี้ สำหรับ Kris Rowley หัวหน้าเจ้าหน้าที่ฝ่ายข้อมูลของ General Services Administration สิ่งนี้เริ่มต้นด้วยการสร้างกลยุทธ์ข้อมูลองค์กร
“สิ่งที่คุณต้องเริ่มต้นจริง ๆ คือการมีส่วนร่วมในระดับบนในการทำความเข้าใจว่าความต้องการ ความท้าทาย และลำดับความสำคัญคืออะไร และเส้นทางที่เข้าถึงได้เพื่อเข้าถึงผู้ปฏิบัติงานด้านข้อมูลเหล่านั้นเพื่อช่วยพิสูจน์วิธีการแก้ปัญหาของคุณ” Rowley กล่าวระหว่างการอภิปราย “เมื่อคุณสร้างโมเมนตัมและพิสูจน์คุณค่าได้ คุณจะเริ่มคิดถึงระบบอัตโนมัติและแง่มุมของเทคโนโลยีรอบตัวมากขึ้น”
แต่หน่วยงานอื่นๆ ยังไม่มีความเข้าใจอย่างถ่องแท้เกี่ยวกับข้อมูลของตนในการเริ่มระบุความท้าทายและลำดับความสำคัญ
“ผมคิดว่าอุปสรรคที่ใหญ่ที่สุดคือการหลีกหนีจากกระดาษ” Oki Mek ที่ปรึกษาอาวุโสของ Chief Information Officer ของ Department of Health and Human Services กล่าวระหว่างการอภิปราย “ฉันคิดว่าคุณต้องเข้าใจข้อมูลก่อนที่คุณจะมีกลยุทธ์ข้อมูล และคุณไม่สามารถวิเคราะห์กระดาษได้”
และการทำความเข้าใจข้อมูลยังเกี่ยวข้องกับการกรองข้อมูลที่เสียหายหรือไม่ถูกต้องออกจากชุดข้อมูลโดยรวม
“เป็นพื้นฐานที่จะต้องมีข้อมูลที่มีคุณภาพและสม่ำเสมอซึ่งคุณสามารถใช้ประโยชน์จากปริมาณมากได้ ดังนั้นหากคุณไม่มีข้อมูลเหล่านั้น คุณจะไม่สามารถเชื่อถือผลลัพธ์ที่คุณมีกับ AI ได้” David Maron นักสถิติจาก Department of Veterans Affairs กล่าวระหว่างการอภิปราย
ทุกอย่างกลับมาพร้อมกับข้อมูลที่ใช้งานได้ และสามารถเข้าถึงและเชื่อถือได้
“ถ้าคุณดูโครงการ AI ที่ประสบความสำเร็จ การเข้าถึงข้อมูลและสารสนเทศจำนวนมหาศาลนั้นขึ้นอยู่กับความต้องการอย่างมาก” Kern กล่าว “แง่มุมที่น่าสนใจของสิ่งนั้นก็คือ ข้อมูลสามารถถูกเก็บไว้ในหลายรูปแบบ: ตอนนี้สามารถมีโครงสร้าง ไม่มีโครงสร้าง หรือแม้แต่เทคโนโลยีวัตถุ ดังนั้นคุณจึงมีเทคโนโลยีที่แตกต่างกันทั้งสามนี้ ซึ่งทั้งหมดจำเป็นต้องมารวมกันเพื่อสร้างผลตอบแทนที่ประสบความสำเร็จจากการลงทุนสำหรับโครงการ AI”
Kern กล่าวว่าเขาเห็นลูกค้าจำนวนมากพยายามรวมข้อมูลทั้งสามประเภทเข้าด้วยกันเป็น Data Lake หรือแม้แต่ Data Oceans แต่แล้วพวกเขาก็ประสบปัญหาในการปฏิบัติตามข้อกำหนดและข้อจำกัดต่างๆ จะเกิดอะไรขึ้นเมื่อคุณมีข้อมูลที่สามารถระบุตัวบุคคลได้ ข้อมูลด้านสุขภาพ และแม้กระทั่งข้อมูลลับที่ต้องจัดการ
“มันกลายเป็นความท้าทายจากมุมมองของข้อมูลเมตาในแง่ของการควบคุมการเข้าถึง และคุณจะจัดการข้อมูลนั้นในทะเลสาบเหล่านั้นได้อย่างไร” Kern กล่าว “และสิ่งที่เราเริ่มเห็นในตอนนี้คือการเกิดขึ้นของเทคโนโลยีที่เรียกว่าโพลีสโตร์ Polystores ช่วยให้คุณจัดเก็บข้อมูลทั้งหมดในรูปแบบดั้งเดิม แต่รวมข้อมูลเมตาไว้ในจุดที่ค้นหาได้และเข้าถึงได้ด้วยการควบคุมการเข้าถึงที่เหมาะสม” การใช้แนวคิดดังกล่าว NetApp ได้พัฒนา Data Pipeline สำหรับระบบ AI ที่ไม่เพียงแต่รวบรวมข้อมูลในรูปแบบต่างๆ เท่านั้น แต่ยังรวมการเข้าถึงข้อมูลไว้ที่ Edge ที่ผลิตหรือรับ จัดระเบียบและประมวลผลข้อมูลในแกนหลักหรือองค์กร และขนส่งหรือจัดการ ข้อมูลในคลาวด์ เทคโนโลยีนี้ช่วยให้หน่วยงานภาครัฐได้รับประโยชน์จากการใช้เทคโนโลยี AI เพื่อปรับปรุงความสำเร็จของภารกิจ เนื่องจากวิศวกรรมที่อยู่เบื้องหลังการ