Niantic ใช้ภาพเมืองใน Pokémon Go จำนวน 30,000 ล้านภาพ สร้างระบบระบุตำแหน่งด้วยภาพที่มีความแม่นยำระดับเซนติเมตร และนำไปทดสอบกับหุ่นยนต์ส่งของจำนวน 1,000 ตัว
บริษัท AI ในเครือ Niantic ซึ่งเป็นผู้พัฒนาเกม Pokémon Go ที่ได้รับความนิยมทั่วโลก Niantic Spatial กำลังใช้ภาพเมืองนับพันล้านภาพที่ผู้เล่นถ่ายไว้เป็นเวลาหลายปี เพื่อสร้างระบบระบุตำแหน่งด้วยภาพ (Visual Positioning System) และโมเดลโลกของ AI ที่สามารถเข้าใจโลกจริงได้ เทคโนโลยีนี้สามารถระบุตำแหน่งในเมืองที่สัญญาณ GPS อ่อนแอได้อย่างแม่นยำ และได้มีการร่วมมือกับบริษัทหุ่นยนต์ส่งของเพื่อทดสอบ นำไปสู่แนวทางใหม่ในการนำทางของหุ่นยนต์และ AI ในโลกจริงในอนาคต
ตั้งแต่ Pokémon Go เปิดตัวในปี 2016 ก็กลายเป็นเกมยอดนิยมระดับโลก ผู้เล่นใช้กล้องบนสมาร์ทโฟนจับ Pokémon ในโลกจริง เกม AR (Augmented Reality) ที่พัฒนาโดย Niantic นี้ แม้จะเปิดตัวมานานแล้ว แต่ยังคงมีผู้เล่นมากกว่า 100 ล้านคนที่ใช้งานอยู่ในแต่ละปี
อย่างไรก็ตาม ระหว่างเล่น ผู้เล่นต้องคอยชำกล้องสมาร์ทโฟนไปยังอาคารและแลนด์มาร์กในเมือง ซึ่งโดยไม่รู้ตัวก็สะสมข้อมูลภาพจำนวนมากให้กับบริษัท
ล่าสุด Niantic Spatial ซึ่งเป็นบริษัท AI ในเครือ Niantic เปิดเผยว่า ได้รวบรวมและจัดระเบียบภาพเมืองจากทั่วโลกประมาณ 30,000 ล้านภาพ ซึ่งแต่ละภาพมีข้อมูลตำแหน่งทางภูมิศาสตร์ที่แม่นยำ รวมถึงทิศทางของโทรศัพท์ ความเร็วในการเคลื่อนที่ และมุมกล้อง ข้อมูลเหล่านี้กำลังถูกนำไปใช้ในการฝึก AI เพื่อสร้างโมเดลโลก (World Model) ที่เข้าใจโลกจริงได้
รายงานจาก NewsForce ระบุว่า เทคโนโลยีล่าสุดของ Niantic Spatial คือ ระบบระบุตำแหน่งด้วยภาพ (Visual Positioning System, VPS) ซึ่งเป็นโมเดล AI ที่วิเคราะห์ภาพอาคารหรือแลนด์มาร์กเพื่อบอกตำแหน่งของผู้ใช้งานได้อย่างแม่นยำถึงระดับเซนติเมตร
บริษัทระบุว่า ฐานข้อมูลปัจจุบันครอบคลุมแลนด์มาร์กกว่า 1 ล้านแห่งทั่วโลก ในแต่ละแห่งจะมีภาพถ่ายหลายพันภาพที่ถ่ายในเวลาต่างกัน มุมกล้องต่างกัน และสภาพอากาศแตกต่างกัน AI จะเปรียบเทียบลักษณะเฉพาะของภาพเหล่านี้เพื่อคำนวณตำแหน่งและทิศทางของอุปกรณ์ ทำให้สามารถประมาณตำแหน่งได้อย่างแม่นยำ
คุณ Brian McClendon หัวหน้าวิศวกรของ Niantic Spatial กล่าวว่า เทคโนโลยีนี้แตกต่างจาก GPS ตรงที่ GPS อาศัยสัญญาณจากดาวเทียม ขณะที่ VPS ใช้การ “มองเห็นสิ่งต่าง ๆ” เพื่อระบุที่อยู่:
ในเมืองที่เต็มไปด้วยตึกสูง สัญญาณ GPS มักผิดเพี้ยนบ่อยครั้ง อาจทำให้ตำแหน่งผิดพลาดไปหลายสิบเมตร หรือแม้แต่บอกทิศทางผิด
ความคลาดเคลื่อนเช่นนี้ไม่ส่งผลต่อผู้ใช้งานทั่วไปมากนัก แต่สำหรับหุ่นยนต์ที่ต้องการนำทางอย่างแม่นยำแล้ว อาจสร้างปัญหาได้ ดังนั้น การใช้เทคโนโลยีระบุตำแหน่งด้วยภาพจึงเป็นแนวทางที่บริษัทหุ่นยนต์ให้ความสนใจ
ปัจจุบัน Niantic Spatial ได้ร่วมมือกับบริษัทหุ่นยนต์ส่งของ Coco Robotics ในการทดสอบเทคโนโลยีนี้ โดย Coco ได้ติดตั้งหุ่นยนต์ส่งของประมาณ 1,000 ตัวในหลายเมืองในสหรัฐอเมริกาและยุโรป ซึ่งใช้สำหรับส่งอาหารและของชำ หุ่นยนต์เหล่านี้มีขนาดคล้ายกระเป๋าเดินทางขนาดเล็ก สามารถบรรจุพิซซ่าใหญ่ได้สูงสุด 8 ชิ้น หรือของชำอีก 4 ถุง
บริษัทระบุว่า ขณะนี้ หุ่นยนต์ส่งของได้ทำงานมากกว่า 500,000 ครั้งแล้ว แต่บางครั้งก็ยังประสบปัญหา GPS หลุด ทำให้หุ่นยนต์ไม่สามารถหยุดตรงหน้าร้านอาหารหรือบ้านลูกค้าได้อย่างแม่นยำ
ด้วยเทคโนโลยีระบุตำแหน่งด้วยภาพของ Niantic หุ่นยนต์สามารถใช้กล้อง 4 ตัวที่ติดตั้งบนตัววิเคราะห์สภาพแวดล้อมรอบตัว เพื่อบอกตำแหน่งและทิศทางการเคลื่อนที่ได้อย่างแม่นยำมากขึ้น ช่วยเพิ่มความน่าเชื่อถือในการส่งของ
คุณ John Hanke ซีอีโอของ Niantic Spatial กล่าวว่า จุดเริ่มต้นของการพัฒนาเทคโนโลยีระบุตำแหน่งด้วยภาพคือ เพื่อสนับสนุนการใช้งาน AR แว่นตาและแอปพลิเคชัน AR แต่เมื่ออุตสาหกรรมหุ่นยนต์เติบโตอย่างรวดเร็ว บริษัทจึงเปลี่ยนแนวทางไปยังการนำทางของหุ่นยนต์
เขาเผยว่า ขณะนี้บริษัทกำลังสร้างระบบที่เรียกว่า “Living Map” ซึ่งเป็นโมเดลโลกดิจิทัลที่ละเอียดและอัปเดตอย่างต่อเนื่อง สามารถปรับปรุงตามการเปลี่ยนแปลงในโลกจริงได้ตลอดเวลา
ในอนาคต หุ่นยนต์ส่งของ อุปกรณ์อัจฉริยะ และแม้แต่ AR อาจกลายเป็นแหล่งข้อมูลของแผนที่ ส่งข้อมูลสภาพแวดล้อมกลับมาอย่างต่อเนื่อง ทำให้โลกดิจิทัลใกล้เคียงกับภาพของโลกจริงมากขึ้นเรื่อย ๆ
ในช่วงไม่กี่ปีที่ผ่านมา วงการวิจัย AI เริ่มให้ความสนใจกับแนวคิด “โมเดลโลก (World Model)” มากขึ้น แม้ว่าโมเดลภาษาใหญ่ (LLM) จะทำผลงานด้านการประมวลผลข้อความและความรู้ได้ดี แต่ยังมีข้อจำกัดในด้านความเข้าใจเชิงกายภาพและสิ่งแวดล้อมจริง
โดยการผสมผสานข้อมูลแผนที่ ภาพถ่าย และข้อมูลสิ่งแวดล้อม โมเดลโลกพยายามทำให้ AI เข้าใจวัตถุ ความสัมพันธ์ในพื้นที่ และการเปลี่ยนแปลงของสิ่งแวดล้อม รวมถึงบริษัทอย่าง Google DeepMind ก็อยู่ระหว่างการพัฒนาโมเดลที่สามารถสร้างโลกเสมือนเพื่อใช้ฝึก AI ตัวแทน
ในขณะเดียวกัน Niantic Spatial ใช้กลยุทธ์ต่างออกไป โดยใช้ข้อมูลภาพจริงจากโลกเป็นจำนวนมาก ค่อย ๆ สร้างโมเดลดิจิทัลของโลกจริงขึ้นมา เมื่อข้อมูลสะสมมากขึ้น ระบบนี้อาจกลายเป็นโครงสร้างพื้นฐานสำคัญสำหรับหุ่นยนต์และ AI ในการเข้าใจโลกจริงในอนาคต