ผู้เล่น Pokémon GO ช่วยฝึกอบรม! Niantic สร้างโมเดล AI สำหรับโลก เพื่อช่วยเหลืออุตสาหกรรมหุ่นยนต์ส่งอาหาร

CryptoCity

Niantic ใช้ภาพเมืองใน Pokémon Go จำนวน 30,000 ล้านภาพ สร้างระบบระบุตำแหน่งด้วยภาพที่มีความแม่นยำระดับเซนติเมตร และนำไปทดสอบกับหุ่นยนต์ส่งของจำนวน 1,000 ตัว

บริษัท AI ในเครือ Niantic ซึ่งเป็นผู้พัฒนาเกม Pokémon Go ที่ได้รับความนิยมทั่วโลก Niantic Spatial กำลังใช้ภาพเมืองนับพันล้านภาพที่ผู้เล่นถ่ายไว้เป็นเวลาหลายปี เพื่อสร้างระบบระบุตำแหน่งด้วยภาพ (Visual Positioning System) และโมเดลโลกของ AI ที่สามารถเข้าใจโลกจริงได้ เทคโนโลยีนี้สามารถระบุตำแหน่งในเมืองที่สัญญาณ GPS อ่อนแอได้อย่างแม่นยำ และได้มีการร่วมมือกับบริษัทหุ่นยนต์ส่งของเพื่อทดสอบ นำไปสู่แนวทางใหม่ในการนำทางของหุ่นยนต์และ AI ในโลกจริงในอนาคต

ภาพผู้เล่น Pokémon Go เป็นข้อมูลฝึก AI สร้างโมเดลโลกจากภาพเมือง

ตั้งแต่ Pokémon Go เปิดตัวในปี 2016 ก็กลายเป็นเกมยอดนิยมระดับโลก ผู้เล่นใช้กล้องบนสมาร์ทโฟนจับ Pokémon ในโลกจริง เกม AR (Augmented Reality) ที่พัฒนาโดย Niantic นี้ แม้จะเปิดตัวมานานแล้ว แต่ยังคงมีผู้เล่นมากกว่า 100 ล้านคนที่ใช้งานอยู่ในแต่ละปี

อย่างไรก็ตาม ระหว่างเล่น ผู้เล่นต้องคอยชำกล้องสมาร์ทโฟนไปยังอาคารและแลนด์มาร์กในเมือง ซึ่งโดยไม่รู้ตัวก็สะสมข้อมูลภาพจำนวนมากให้กับบริษัท

ล่าสุด Niantic Spatial ซึ่งเป็นบริษัท AI ในเครือ Niantic เปิดเผยว่า ได้รวบรวมและจัดระเบียบภาพเมืองจากทั่วโลกประมาณ 30,000 ล้านภาพ ซึ่งแต่ละภาพมีข้อมูลตำแหน่งทางภูมิศาสตร์ที่แม่นยำ รวมถึงทิศทางของโทรศัพท์ ความเร็วในการเคลื่อนที่ และมุมกล้อง ข้อมูลเหล่านี้กำลังถูกนำไปใช้ในการฝึก AI เพื่อสร้างโมเดลโลก (World Model) ที่เข้าใจโลกจริงได้

ระบบระบุตำแหน่งด้วยภาพ vs GPS: AI สามารถระบุที่ตั้งได้จากภาพอาคาร

รายงานจาก NewsForce ระบุว่า เทคโนโลยีล่าสุดของ Niantic Spatial คือ ระบบระบุตำแหน่งด้วยภาพ (Visual Positioning System, VPS) ซึ่งเป็นโมเดล AI ที่วิเคราะห์ภาพอาคารหรือแลนด์มาร์กเพื่อบอกตำแหน่งของผู้ใช้งานได้อย่างแม่นยำถึงระดับเซนติเมตร

บริษัทระบุว่า ฐานข้อมูลปัจจุบันครอบคลุมแลนด์มาร์กกว่า 1 ล้านแห่งทั่วโลก ในแต่ละแห่งจะมีภาพถ่ายหลายพันภาพที่ถ่ายในเวลาต่างกัน มุมกล้องต่างกัน และสภาพอากาศแตกต่างกัน AI จะเปรียบเทียบลักษณะเฉพาะของภาพเหล่านี้เพื่อคำนวณตำแหน่งและทิศทางของอุปกรณ์ ทำให้สามารถประมาณตำแหน่งได้อย่างแม่นยำ

คุณ Brian McClendon หัวหน้าวิศวกรของ Niantic Spatial กล่าวว่า เทคโนโลยีนี้แตกต่างจาก GPS ตรงที่ GPS อาศัยสัญญาณจากดาวเทียม ขณะที่ VPS ใช้การ “มองเห็นสิ่งต่าง ๆ” เพื่อระบุที่อยู่:

ในเมืองที่เต็มไปด้วยตึกสูง สัญญาณ GPS มักผิดเพี้ยนบ่อยครั้ง อาจทำให้ตำแหน่งผิดพลาดไปหลายสิบเมตร หรือแม้แต่บอกทิศทางผิด

ความคลาดเคลื่อนเช่นนี้ไม่ส่งผลต่อผู้ใช้งานทั่วไปมากนัก แต่สำหรับหุ่นยนต์ที่ต้องการนำทางอย่างแม่นยำแล้ว อาจสร้างปัญหาได้ ดังนั้น การใช้เทคโนโลยีระบุตำแหน่งด้วยภาพจึงเป็นแนวทางที่บริษัทหุ่นยนต์ให้ความสนใจ

จากการเก็บภาพในเกมสู่การส่งของ: หุ่นยนต์ส่งของเริ่มนำเทคโนโลยี Niantic ไปใช้

ปัจจุบัน Niantic Spatial ได้ร่วมมือกับบริษัทหุ่นยนต์ส่งของ Coco Robotics ในการทดสอบเทคโนโลยีนี้ โดย Coco ได้ติดตั้งหุ่นยนต์ส่งของประมาณ 1,000 ตัวในหลายเมืองในสหรัฐอเมริกาและยุโรป ซึ่งใช้สำหรับส่งอาหารและของชำ หุ่นยนต์เหล่านี้มีขนาดคล้ายกระเป๋าเดินทางขนาดเล็ก สามารถบรรจุพิซซ่าใหญ่ได้สูงสุด 8 ชิ้น หรือของชำอีก 4 ถุง

บริษัทระบุว่า ขณะนี้ หุ่นยนต์ส่งของได้ทำงานมากกว่า 500,000 ครั้งแล้ว แต่บางครั้งก็ยังประสบปัญหา GPS หลุด ทำให้หุ่นยนต์ไม่สามารถหยุดตรงหน้าร้านอาหารหรือบ้านลูกค้าได้อย่างแม่นยำ

ด้วยเทคโนโลยีระบุตำแหน่งด้วยภาพของ Niantic หุ่นยนต์สามารถใช้กล้อง 4 ตัวที่ติดตั้งบนตัววิเคราะห์สภาพแวดล้อมรอบตัว เพื่อบอกตำแหน่งและทิศทางการเคลื่อนที่ได้อย่างแม่นยำมากขึ้น ช่วยเพิ่มความน่าเชื่อถือในการส่งของ

ยุคหุ่นยนต์มาแล้ว: Niantic ต้องการสร้าง “แผนที่มีชีวิต”

คุณ John Hanke ซีอีโอของ Niantic Spatial กล่าวว่า จุดเริ่มต้นของการพัฒนาเทคโนโลยีระบุตำแหน่งด้วยภาพคือ เพื่อสนับสนุนการใช้งาน AR แว่นตาและแอปพลิเคชัน AR แต่เมื่ออุตสาหกรรมหุ่นยนต์เติบโตอย่างรวดเร็ว บริษัทจึงเปลี่ยนแนวทางไปยังการนำทางของหุ่นยนต์

เขาเผยว่า ขณะนี้บริษัทกำลังสร้างระบบที่เรียกว่า “Living Map” ซึ่งเป็นโมเดลโลกดิจิทัลที่ละเอียดและอัปเดตอย่างต่อเนื่อง สามารถปรับปรุงตามการเปลี่ยนแปลงในโลกจริงได้ตลอดเวลา

ในอนาคต หุ่นยนต์ส่งของ อุปกรณ์อัจฉริยะ และแม้แต่ AR อาจกลายเป็นแหล่งข้อมูลของแผนที่ ส่งข้อมูลสภาพแวดล้อมกลับมาอย่างต่อเนื่อง ทำให้โลกดิจิทัลใกล้เคียงกับภาพของโลกจริงมากขึ้นเรื่อย ๆ

AI ต้องเข้าใจโลกจริง: “World Model” กลายเป็นจุดสนใจใหม่ของเทคโนโลยี

ในช่วงไม่กี่ปีที่ผ่านมา วงการวิจัย AI เริ่มให้ความสนใจกับแนวคิด “โมเดลโลก (World Model)” มากขึ้น แม้ว่าโมเดลภาษาใหญ่ (LLM) จะทำผลงานด้านการประมวลผลข้อความและความรู้ได้ดี แต่ยังมีข้อจำกัดในด้านความเข้าใจเชิงกายภาพและสิ่งแวดล้อมจริง

โดยการผสมผสานข้อมูลแผนที่ ภาพถ่าย และข้อมูลสิ่งแวดล้อม โมเดลโลกพยายามทำให้ AI เข้าใจวัตถุ ความสัมพันธ์ในพื้นที่ และการเปลี่ยนแปลงของสิ่งแวดล้อม รวมถึงบริษัทอย่าง Google DeepMind ก็อยู่ระหว่างการพัฒนาโมเดลที่สามารถสร้างโลกเสมือนเพื่อใช้ฝึก AI ตัวแทน

ในขณะเดียวกัน Niantic Spatial ใช้กลยุทธ์ต่างออกไป โดยใช้ข้อมูลภาพจริงจากโลกเป็นจำนวนมาก ค่อย ๆ สร้างโมเดลดิจิทัลของโลกจริงขึ้นมา เมื่อข้อมูลสะสมมากขึ้น ระบบนี้อาจกลายเป็นโครงสร้างพื้นฐานสำคัญสำหรับหุ่นยนต์และ AI ในการเข้าใจโลกจริงในอนาคต

  • บทความนี้ได้รับอนุญาตให้นำเสนอซ้ำจาก:《鏈新聞》
  • หัวข้อเดิม: 《宝可梦玩家替公司训练 300 亿张照片打造“AI 世界模型”,助攻外送机器人产业》
  • ผู้เขียน: Crumax
ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น