Lĩnh vực robot và trí tuệ nhân tạo (AI) đã đạt được những tiến bộ đáng kể trong vài năm qua, nhờ những tiến bộ nhanh chóng trong AI tổng quát và Mô hình ngôn ngữ lớn (LLM). Google Research, một công ty mạnh về nghiên cứu AI, đã đi đầu trong cuộc cách mạng này, khám phá những cách mới để tích hợp LLM và robot nhằm cải thiện năng suất của con người và nâng cao chất lượng cuộc sống.
Trong bài viết này, chúng ta sẽ thảo luận về Google Research’s latest breakthroughs in the field of robotics and AI, tập trung vào ý nghĩa của những công nghệ mới này và lý do tại sao rô-bốt và tự động hóa sẽ là những thứ tiếp theo bị cuốn theo làn sóng LLM mới. Tuy nhiên, chúng ta cũng phải lưu ý rằng các công việc truyền thống có thể biến mất sớm hơn dự kiến khi công nghệ tiến xa hơn.
Tăng cường khả năng học tập của rô-bốt với các mô hình ngôn ngữ lớn
Trong cuộc đời của mình, chúng ta sẽ thấy các công nghệ robot có thể hỗ trợ các hoạt động hàng ngày, nâng cao năng suất và chất lượng cuộc sống của con người. Trước khi robot có thể hữu ích rộng rãi trong việc trợ giúp các công việc thực tế hàng ngày trong không gian lấy con người làm trung tâm, chúng cần có khả năng hỗ trợ con người một cách an toàn & hiệu quả.
Vào năm 2022, Nghiên cứu của Google tập trung vào những thách thức liên quan đến việc cho phép rô-bốt trở nên hữu ích hơn với con người. Một trong những thách thức lớn nhất là cho phép robot và con người giao tiếp hiệu quả và tự nhiên hơn. Việc cho phép rô-bốt hiểu và áp dụng kiến thức thông thường trong các tình huống thực tế, cũng như nhân rộng số lượng kỹ năng cấp thấp mà rô-bốt cần để thực hiện hiệu quả các nhiệm vụ trong môi trường phi cấu trúc cũng rất cần thiết.
Một xu hướng nổi bật trong năm qua là việc khám phá xem các mô hình tổng thể, lớn như PaLM có thể hoạt động như thế nào cùng với các phương pháp tiếp cận khác đối với các khả năng bề mặt cho phép rô-bốt học hỏi từ kiến thức rộng của con người và cho phép mọi người tương tác với rô-bốt một cách tự nhiên hơn. Khi chúng tôi làm điều này, chúng tôi đang biến quá trình học của robot thành một vấn đề dữ liệu có thể mở rộng để chúng tôi có thể mở rộng quy mô học các kỹ năng cấp thấp tổng quát, chẳng hạn như thao tác.
Ngôn ngữ lớn và các mô hình đa phương thức giúp rô-bốt hiểu bối cảnh mà chúng đang hoạt động, chẳng hạn như điều gì đang xảy ra trong một cảnh và rô-bốt phải làm gì. Nhưng rô-bốt cũng cần các kỹ năng thể chất ở mức độ thấp để hoàn thành các nhiệm vụ trong thế giới vật chất, chẳng hạn như nhặt và đặt đồ vật một cách chính xác.
Mặc dù chúng ta thường coi những kỹ năng thể chất này là điều hiển nhiên, thực hiện chúng hàng trăm lần mỗi ngày mà không cần suy nghĩ, nhưng chúng lại đưa ra những thách thức đáng kể đối với robot. Khó khăn trong việc học những kỹ năng cấp thấp này được gọi là Nghịch lý Moravec: lý luận đòi hỏi rất ít tính toán, nhưng kỹ năng nhận thức và vận động cảm ứng lại yêu cầu tài nguyên máy tính khổng lồ.
Lấy cảm hứng từ thành công gần đây của LLM, cho thấy khả năng khái quát hóa và hiệu suất của các mô hình lớn dựa trên Máy biến áp sẽ thay đổi quy mô theo lượng dữ liệu, Google Research đang áp dụng phương pháp tiếp cận dựa trên dữ liệu, biến vấn đề học các kỹ năng thể chất cấp thấp thành một vấn đề dữ liệu có thể mở rộng.
Robotics Transformer-1: Biến Robot Learning thành một vấn đề về dữ liệu có thể mở rộng
Với Robotics Transformer-1 (RT-1), Nghiên cứu của Google đã đào tạo chính sách thao tác với rô bốt trên bộ dữ liệu rô bốt trong thế giới thực, quy mô lớn gồm 130 nghìn tập bao gồm hơn 700 nhiệm vụ bằng cách sử dụng một nhóm gồm 13 rô bốt từ Everyday Robots. Kết quả cho thấy rằng việc tăng quy mô và tính đa dạng của dữ liệu sẽ cải thiện khả năng khái quát hóa của mô hình đối với các nhiệm vụ, môi trường và đối tượng mới.
Đằng sau cả hai mô hình ngôn ngữ và nhiều phương pháp học tập rô-bốt của chúng tôi, như RT-1, là Máy biến áp, cho phép các mô hình hiểu được dữ liệu ở quy mô Internet. Không giống như LLM, người máy bị thách thức bởi các biểu diễn đa phương thức của môi trường thay đổi liên tục và khả năng tính toán hạn chế.
Vào năm 2020, Nghiên cứu của Google đã giới thiệu Người biểu diễn như một phương pháp giúp Transformers hiệu quả hơn về mặt tính toán, điều này có ý nghĩa đối với nhiều ứng dụng ngoài robot. Trong Performanceer-MPC, Google Research đã áp dụng điều này để giới thiệu một lớp chính sách kiểm soát ngầm mới kết hợp lợi ích của việc học bắt chước với khả năng xử lý mạnh mẽ các ràng buộc hệ thống từ các phương pháp tiếp cận dựa trên dữ liệu trong chế tạo rô-bốt
Một trong những trở ngại chính đối với sự phát triển của robot là thiếu dữ liệu so với các lĩnh vực AI khác, chẳng hạn như xử lý ngôn ngữ tự nhiên và thị giác máy tính. Tuy nhiên, Google Research đang tìm cách vượt qua thách thức này và biến các phương pháp tiếp cận dựa trên dữ liệu thành hiện thực trong thế giới người máy.
Nhóm đã sử dụng các bộ dữ liệu rô-bốt trong thế giới thực, quy mô lớn cho các kỹ năng thể chất, chẳng hạn như nhặt và đặt chính xác các đồ vật. Với cách tiếp cận Robotics Transformer-1 (RT-1), họ đã đào tạo chính sách thao tác rô-bốt trên bộ dữ liệu gồm hơn 130.000 tập bao gồm hơn 700 nhiệm vụ khác nhau, sử dụng một đội gồm 13 rô-bốt từ Everyday Robots. Cách tiếp cận này đã chỉ ra rằng việc tăng quy mô và tính đa dạng của dữ liệu có thể cải thiện khả năng khái quát hóa của mô hình đối với các nhiệm vụ, môi trường và đối tượng mới.
Nghiên cứu của Google cũng đã khám phá việc sử dụng mô phỏng như một cách để thu thập dữ liệu hiệu quả và an toàn hơn. Tuy nhiên, rất khó để tái tạo toàn bộ môi trường trong mô phỏng, đặc biệt là các tương tác vật lý và người-rô-bốt. Trong dự án i-Sim2Real của mình, họ đã giải quyết vấn đề này bằng cách khởi động từ một mô hình đơn giản về hành vi của con người và xen kẽ giữa đào tạo mô phỏng và triển khai trong thế giới thực để dạy rô-bốt chơi bóng bàn với đối thủ là con người.
Ngoài ra, Google Research đang khám phá các cách để rô-bốt học hỏi bằng cách quan sát con người. Bằng cách sử dụng phương pháp Học tăng cường nghịch đảo hiện thân chéo, rô-bốt có thể học các nhiệm vụ mới bằng cách xem mọi người thực hiện chúng, điều này có thể cho phép thu thập dữ liệu hiệu quả hơn và tiếp thu kỹ năng nhanh hơn.
Triển vọng lạc quan với một cảnh báo
Mặc dù những tiến bộ về robot và AI này rất thú vị, nhưng điều quan trọng là phải xem xét những tác động đối với tương lai của công việc. Tự động hóa và người máy có khả năng thay thế một số công việc nhất định và sự phát triển nhanh chóng của công nghệ AI có nghĩa là điều này có thể xảy ra sớm hơn dự kiến.
Tuy nhiên, điều quan trọng cần nhớ là những tiến bộ công nghệ trong lịch sử đã tạo ra nhiều việc làm và ngành công nghiệp mới, và xu hướng này có thể sẽ tiếp tục. Các công việc lặp đi lặp lại và có thể dự đoán được có thể bị thay thế, nhưng các công việc mới sẽ được tạo ra trong các lĩnh vực như thiết kế, bảo trì và sửa chữa người máy. Ngoài ra, năng suất và hiệu quả tăng lên mà robot có thể mang lại cho một số ngành nhất định có thể tạo ra cơ hội việc làm mới trong những ngành đó.
Như với bất kỳ công nghệ mới nào, điều quan trọng là phải xem xét các tác động đạo đức tiềm ẩn và đảm bảo rằng nó đang được sử dụng một cách có trách nhiệm và an toàn. Nghiên cứu của Google đã nhấn mạnh tầm quan trọng của việc phát triển các hệ thống AI an toàn và mạnh mẽ có thể hoạt động cùng với con người và nâng cao khả năng của họ.
Kết luận
Những tiến bộ về trí tuệ nhân tạo và người máy do Google Research tạo ra thực sự đáng chú ý, với tiềm năng thay đổi cách chúng ta sống và làm việc. Việc sử dụng các mô hình ngôn ngữ lớn và phương pháp tiếp cận dựa trên dữ liệu đang giúp đưa rô-bốt và tự động hóa lên một tầm cao mới, giúp rô-bốt có thể học và hiểu thế giới xung quanh theo những cách mà trước đây không thể làm được.
Mặc dù những phát triển này rất thú vị nhưng điều quan trọng là phải tiếp cận chúng một cách thận trọng và xem xét tác động tiềm ẩn đối với lực lượng lao động. Tuy nhiên, bằng cách tập trung vào phát triển có trách nhiệm và an toàn, chúng tôi có thể đảm bảo rằng những công nghệ này được sử dụng để nâng cao năng suất và chất lượng cuộc sống của con người.
Cuối cùng, rõ ràng là Google Research sẽ tiếp tục là một cường quốc trong lĩnh vực AI và người máy, thúc đẩy sự đổi mới và vượt qua ranh giới của những gì có thể. Với khả năng thay đổi thế giới mà những công nghệ này mang lại, tương lai đang tươi sáng hơn bao giờ hết.