OpenAI là một công ty nghiên cứu trí tuệ nhân tạo (AI) được thành lập vào năm 2015 bởi một số tên tuổi lớn trong ngành công nghệ như Elon Musk, Sam Altman và Greg Brockman, cùng với một số nhà nghiên cứu hàng đầu về trí tuệ nhân tạo. Mục tiêu của công ty là nghiên cứu và phát triển trí tuệ nhân tạo thông minh, an toàn và hữu ích cho con người. Công ty tập trung vào các lĩnh vực như học sâu, robotica, tiếng nói, và tự động hóa.
Tôi cũng tò mò, lập tài khoản và đặt một số câu hỏi mà phần lớn người Việt Nam đều biết câu trả lời nhưng tôi nhận được những câu trả lời rất nghịch ngợm và vui.
TL: Ai là chủ tịch nước Việt Nam hiện nay?
Chat GPT: Chủ tịch nước Việt Nam hiện tại là ông Nguyễn Xuân Phúc. TL: Chuyển đổi số là gì?
Chat GPT: Chuyển đổi số là một quá trình chuyển từ một hệ số sang hệ số khác. Điều này có thể được thực hiện cho các số hệ nhị phân, thập lục phân, thập phân hoặc bất kỳ hệ số nào khác. Mục đích của việc chuyển đổi số là để dễ dàng hơn khi thực hiện các phép toán với số đó hoặc để dễ dàng giao tiếp giữa các hệ thống máy tính khác nhau.
TL: Đổi mới sáng tạo là gì?
Chat GPT: "Đổi mới sáng tạo" là một chương trình hoặc chiến lược kinh doanh hoặc xã hội được thiết kế để thay đổi hoặc cải tiến các quy trình, sản phẩm hoặc dịch vụ để tạo ra giá trị cho người dùng hoặc tổ chức. Nó yêu cầu sáng tạo và sáng kiến để tìm ra các cách mới để làm việc hoặc sản xuất, và cải tiến hoặc thay thế các quy trình cũ hoặc kỹ thuật. Mục đích của "Đổi mới sáng tạo" là tăng cường hiệu quả, giảm chi phí và tăng cường sự hài lòng của khách hàng.
Tôi thở phào nhẹ nhõm và kết luận xanh rờn là các nhà báo vẫn chưa lo mất việc. Nhưng khi tìm hiểu kỹ hơn mới biết Chat GPT chỉ có dữ liệu đến năm 2021, còn bác Phúc thì mới nghỉ trong năm nay. Câu trả lời về “chuyển đổi số” là do mình viết tắt và bỏ từ “kỹ thuật” từ chữ “digital transformation”, Google dịch thành “chuyển đổi kỹ thuật số”, với câu hỏi “Chuyển đổi kỹ thuật số là gì?” thì câu trả lời của Chat GPT rất tốt. Tương tự như với khái niệm “đổi mới sáng tạo” là hai khái niệm khác nhau nhưng liên quan đến nhau mà mình gộp chung vì “sáng tạo” là quá trình tạo ra những ý tưởng mới, trong khi “đổi mới” là quá trình áp dụng những ý tưởng sáng tạo để tạo ra giá trị và sự thay đổi, “sáng tạo” phải có trước thì mới “đổi mới” được, “sáng tạo” và “đổi mới” đều cần hệ sinh thái của nó, không thể tách riêng “sáng tạo” hay “đổi mới” ra rồi đưa vào các trung tâm “Đổi mới sáng tạo” như chúng ta mong muốn được.
Có nghĩa là những khái niệm mới mà chúng ta viết tắt hay còn mơ hồ thì Chat GPT không có thông tin và câu trả lời sẽ ngớ ngẩn. Cách tốt nhất là đặt câu hỏi tiếng Anh rồi nhờ Chat GPT dịch ra tiếng Việt thì kết quả sẽ tốt hơn. Có lẽ chất lượng của từ điển Anh-Việt số, từ điển đồng nghĩa tiếng Việt số và từ điển tiếng Việt số có vấn đề chăng(?).
Chat GPT là gì?
Chat GPT là một mô hình xử lý ngôn ngữ tự nhiên thế hệ mới dựa trên kiến trúc học sâu 'biến áp' - transformer và lượng dữ liệu lớn khổng lồ, được đào tạo trên siêu máy tính AI của Azure. Mô hình này có khả năng xử lý một lượng lớn văn bản và học cách thực hiện các tác vụ xử lý ngôn ngữ tự nhiên rất hiệu quả. Đặc biệt, mô hình GPT-3 có kích thước 175 tỷ tham số, khiến nó trở thành mô hình ngôn ngữ lớn nhất từng được đào tạo. Để làm việc, GPT cần được "đào tạo" trên một lượng lớn văn bản. Ví dụ, mô hình GPT-3 đã được đào tạo trên một cơ sở dữ liệu bao gồm hơn 8 triệu tài liệu và hơn 10 tỷ từ. Từ cơ sở dữ liệu này, mô hình học cách thực hiện các nhiệm vụ xử lý ngôn ngữ tự nhiên và tạo ra văn bản mạch lạc, được viết tốt. Một khi mô hình được đào tạo tốt, GPT có thể được sử dụng để thực hiện một loạt các nhiệm vụ:
- Để tạo ra các câu trả lời phù hợp và nhất quán cho một trợ lý ảo trong nhiều ngữ cảnh.
- Để tạo ra các bài đăng và tin nhắn hấp dẫn cho các mạng xã hội.
- Có thể tạo báo cáo, e-mail và nội dung khác cho các ứng dụng năng suất.
- Có thể được phân tích và thông tin có giá trị có thể được trích xuất từ chúng.
Làm sao Chat GPT có thể trả lời câu hỏi?
Chat GPT có thể trả lời câu hỏi dựa trên phương pháp học máy (machine learning), đặc biệt là mô hình học sâu (deep learning). Chat GPT được huấn luyện trên một lượng lớn dữ liệu văn bản và sử dụng mô hình biến áp (transformer) để hiểu và xử lý thông tin trong các câu hỏi. Mô hình biến áp là một mô hình học sâu đặc biệt được sử dụng cho các tác vụ xử lý ngôn ngữ tự nhiên và có khả năng giải quyết vấn đề về phụ thuộc xa (long-range dependency) trong các chuỗi văn bản.
Cụ thể, Chat GPT sử dụng kiến trúc mạng nơ ron tự động dịch (auto-regressive neural network) để dự đoán từ tiếp theo trong câu trả lời dựa trên các từ trước đó. Điều này có nghĩa là Chat GPT có khả năng "nhớ" và sử dụng thông tin từ cả câu hỏi và các văn bản đã huấn luyện để tạo ra các câu trả lời phù hợp. Khi nhận được câu hỏi mới, Chat GPT sẽ xác định các từ và cụm từ quan trọng trong câu hỏi, tìm kiếm các câu tương tự trong tập dữ liệu huấn luyện và tạo ra câu trả lời dựa trên những thông tin đó.
Chẳng hạn, nếu bạn hỏi Chat GPT "Ai là người đầu tiên bước chân lên Mặt trăng?", Chat GPT sẽ sử dụng mô hình học sâu để hiểu và phân tích câu hỏi này. Trước tiên, Chat GPT sẽ xác định các từ và cụm từ quan trọng trong câu hỏi, chẳng hạn như "người đầu tiên", "bước chân lên", "Mặt trăng". Sau đó, Chat GPT sẽ tìm kiếm trong tập dữ liệu huấn luyện các câu liên quan đến chủ đề này và sử dụng thông tin đó để tạo ra câu trả lời phù hợp. Trong trường hợp này, Chat GPT có thể sử dụng thông tin về chuyến bay lên mặt trăng vào năm 1969 của các nhà du hành vũ trụ Neil Armstrong và Buzz Aldrin để đưa ra câu trả lời chính xác: "Neil Armstrong là người đầu tiên bước chân lên Mặt trăng."
Chat GPT được phát triển trên ngôn ngữ và phương pháp nào?
Chat GPT được phát triển trên ngôn ngữ lập trình Python và sử dụng một số thư viện chính của Python để xử lý và phân tích dữ liệu, đặc biệt là thư viện TensorFlow để triển khai mô hình học sâu (deep learning). Ngoài ra, Chat GPT cũng sử dụng nhiều công nghệ và công cụ khác nhau để đảm bảo tính chính xác và độ tin cậy của thông tin được cung cấp cho người dùng.
Theo OpenAI, họ đã sử dụng nhiều phương pháp và mô hình để phát triển Chat GPT-3, bao gồm:
- Xử lý ngôn ngữ tự nhiên sâu - DNLP (Deep Natural Language Processing) là một phương pháp sử dụng các mô hình mạng nơ-ron sâu để xử lý ngôn ngữ tự nhiên. Trong đó, các mô hình hoc sâu - Deep Learning được sử dụng để giải quyết các vấn đề trong xử lý ngôn ngữ tự nhiên như ngữ pháp, cú pháp, ngữ nghĩa, tương đồng nội dung, dịch máy, tự động tóm tắt văn bản, phân tích cảm xúc, và nhiều ứng dụng khác. Chat GPT sử dụng các phương pháp DNLP để xử lý và trả lời các câu hỏi của người dùng. Nó sử dụng mô hình mạng nơ-ron sâu để học từ dữ liệu và xác định các mối quan hệ và sự tương đồng giữa các từ và câu. Sau đó, Chat GPT sử dụng mô hình này để tạo ra các phản hồi tự động và đưa ra các đề xuất và giải pháp cho người dùng.
- Học chuyển giao (transfer learning): Đây là một phương pháp học máy mà một mô hình học từ một tập dữ liệu và sau đó chuyển học được đến các tác vụ khác. OpenAI đã sử dụng học chuyển giao để phát triển Chat GPT-3 bằng cách huấn luyện mô hình trên các tập dữ liệu lớn và sau đó sử dụng kết quả này để tạo ra một mô hình ngôn ngữ tự nhiên tốt hơn.
- Xử lý ngôn ngữ tự nhiên (NLP - Natural Language Processing): Đây là một lĩnh vực trong học máy tập trung vào việc phân tích, xử lý và tạo ra ngôn ngữ tự nhiên, chẳng hạn như văn bản, giọng nói và ngôn ngữ của con người. Chat GPT-3 là một mô hình NLP được xây dựng trên các phương pháp và mô hình học máy này.
- Phản hồi (Human feedback) dựa trên dữ liệu đã học từ người dùng để tạo ra một câu trả lời có thể không chính xác hoặc không đầy đủ. Vì vậy, để cải thiện chất lượng của câu trả lời, Chat GPT có thể yêu cầu người dùng cung cấp thêm thông tin bằng cách yêu cầu phản hồi từ con người. Người dùng có thể đánh giá câu trả lời của Chat GPT là chính xác hay không, cũng như đưa ra sự phản hồi để cải thiện câu trả lời.
Tuy nhiên, cụ thể phương pháp nào được sử dụng trong Chat GPT phụ thuộc vào mục đích cụ thể của ứng dụng và các bước tiền xử lý dữ liệu.
Microsoft độc quyền về mô hình Chat GPT-3
Phiên bản đầu tiên của Chat GPT - GPT-1 - chỉ được ra mắt vào cuối năm 2018. Sau đó, OpenAI đã tiếp tục phát triển các phiên bản mới của Chat GPT, bao gồm GPT-2 và GPT-3, với số lượng tham số tăng dần lên đáng kể và khả năng xử lý ngôn ngữ tự nhiên ngày càng tốt hơn. Chat GPT -3 có thể nói gần giống “người” nhất.
Tháng 9, năm 2020, Microsoft đánh giá “Chat GPT-3 một mô hình ngôn ngữ tự động tạo ra văn bản giống con người nhất, mô hình ngôn ngữ lớn nhất và tiên tiến nhất trên thế giới” và hợp tác với OpenAI để cấp phép độc quyền mô hình ngôn ngữ GPT-3 và tận dụng các cải tiến kỹ thuật của Microsoft, phát triển và cung cấp các giải pháp trí tuệ nhân tạo tiên tiến cho khách hàng của họ, cũng như tạo ra các giải pháp mới khai thác sức mạnh đáng kinh ngạc của việc tạo ngôn ngữ tự nhiên tiên tiến. Sản phẩm thương mại hóa gọi là Chat GPT Plus và Chat GPT mở hiện có những hạn chế về số liệu và mô hình nên có những kết quả như phần mở đầu đã viết.
Việc Microsoft độc quyền về mô hình Chat GPT-3 gây ra tranh cãi về bản quyền các dữ liệu mở như Wikipedia và Common Crawl... và hầu hết các trang internet vì các câu trả lời của Chat GPT không có dẫn nguồn tham chiếu từ đâu.
Chat GPT có nguy hiểm cho con người không?
Trong hiện tại, Chat GPT không gây nguy hiểm trực tiếp cho con người. Tuy nhiên, việc sử dụng trí tuệ nhân tạo và các công nghệ liên quan đến Chat GPT có thể gây ra những vấn đề đạo đức và pháp lý.
Nếu được sử dụng đúng cách, Chat GPT và các công nghệ liên quan đến trí tuệ nhân tạo có thể mang lại nhiều lợi ích cho con người, từ việc giải quyết các vấn đề khó khăn đến cải thiện chất lượng cuộc sống. Tuy nhiên, nếu không được sử dụng đúng cách, Chat GPT có thể dẫn đến các vấn đề như xâm phạm quyền riêng tư, phân biệt chủng tộc, bạo lực, hoặc thậm chí có thể gây ra tai hại cho con người như:
- Tạo đầu ra thiên vị hoặc độc hại: một mô hình ngôn ngữ được đào tạo về dữ liệu thiên vị hay độc hại có thể tái tạo mô hình đó trong đầu ra của nó, ngay cả khi nó không được hướng dẫn rõ ràng để làm như vậy.
- Làm sai: không làm theo hướng dẫn rõ ràng của người dùng.
- Ảo giác: mô hình tạo nên những sự thật không tồn tại hoặc sai lầm.
- Thiếu khả năng diễn giải: rất khó để con người hiểu làm thế nào mô hình đi đến một quyết định hoặc dự đoán cụ thể.
Việc đảm bảo an toàn và đạo đức trong việc phát triển và sử dụng trí tuệ nhân tạo là rất quan trọng để đảm bảo lợi ích cho con người.
Gần đây chính quyền Trung Quốc (TQ) đã cấm sử dụng Chat GPT và dùng bức tường lửa “Vạn lý trường thành” để chặn người truy cập với lý do “Mỹ sử dụng AI để truyền bá thông tin sai lệch”. Điều này tương đối dễ hiểu vì TQ đã cấm người dùng truy cập Google, Facebook... hay các trang Web bị cho là “độc hại” và gây thiệt thòi cho người dùng “bình thường” nhưng những người có chút trình độ CNTT vẫn truy cập được dễ dàng.
Tuy vậy, Chat GPT là nguồn cảm hứng cho các công ty khác phát triển sản phẩm tương tự như Google Bard hay Baidu ERNIE (Trung Quốc). Hy vọng, chúng ta sẽ có những sản phẩm “giống người” hơn trong tương lai gần.
Việt Nam nên làm gì?
Việt Nam nên bắt đầu xây dựng những API – giao diện cho các ứng dụng với các giao thức chuẩn đến các thư viện từ điển tiếng Việt số, từ điển đồng nghĩa tiếng Việt số, từ điển Việt – Anh/Anh-Việt... vì nó là nền tảng để giúp phát triển tốt hơn trợ lý ảo, các ứng dụng xử lý ngôn ngữ tự nhiên bằng tiếng Việt trong tương lai. Bên cạnh đó, cần có luật quy định ứng xử và sử dụng đúng cách các sản phẩm trí tuệ nhân tạo để tránh những lạm dụng như đã bàn ở trên.
Những ứng dụng của các sản phẩm trí tuệ nhân tạo - AI là vô cùng rộng lớn nhưng không hoạt động tốt nếu không có dữ liệu lớn, mô hình xử lý dữ liệu tốt và siêu máy tính. Trong đó dữ liệu là mỏ “dầu” từ sản phẩm đầu ra của những ứng dụng hay thiết bị IoT mà các chuyên gia CNTT phát triển. Nhà nước nên chú trọng hơn nữa việc đào tạo CNTT và tạo môi trường làm việc cho tài năng thực sự giỏi. Lấy việc đẩy mạnh chuyển đổi số và phát triển sản phẩm CNTT như một trong những chiến lược quan trọng nhất để phát triển đất nước như đã bàn trong các bài viết trước.