Vừa qua, OpenAI vừa công bố phiên bản GPT-4 của mình với những tính năng mới được cập nhật và nâng cấp nhằm tăng độ hài lòng cho người sử dụng cũng như tăng khả năng xử lý của mô hình AI mà họ tạo ra. Đây là một trong những bước phát triển lớn mà OpenAI mang lại. Sau đây, hãy cùng Tin Học Đại Việt tìm hiểu về GPT-4 có những điểm gì mới so với những phiên bản trước của mình nhé
1. GPT-4 Là Gì?
- Generative Pre-training Transformers (GPT) là một loại mô hình học sâu được sử dụng để tạo văn bản giống con người. Các mục đích sử dụng phổ biến bao gồm: trả lời câu hỏi – tóm tắt văn bản – dịch văn bản sang các ngôn ngữ khác – tạo mã tạo bài đăng trên blog, câu chuyện, cuộc hội thoại và các loại nội dung khác.
- Việc phát hành GPT-4 gần đây đánh dấu một cột mốc quan trọng trong lĩnh vực trí tuệ nhân tạo, đặc biệt là trong xử lý ngôn ngữ tự nhiên. GPT-4 là một mô hình đa phương thức lớn có thể chấp nhận cả đầu vào hình ảnh và văn bản và tạo đầu ra văn bản.
- Các phiên bản trước bao gồm: GPT-1, GPT-2, GPT-3, GPT-3.5
2. Những Tính Năng Khủng Của GPT-4
2.1 GPT-4 Có Thể Hiểu Những Input Phức Tạp Hơn
Một trong những tính năng mới nhất của GPT-4 là khả năng hiểu các lời nhắc phức tạp và nhiều sắc thái hơn. Theo OpenAI, GPT-4 “thể hiện hiệu suất ở cấp độ con người trên các tiêu chuẩn chuyên môn và học thuật khác nhau.” Điều này đã được chứng minh bằng cách đưa GPT-4 vượt qua một số bài kiểm tra cấp độ con người và bài kiểm tra tiêu chuẩn hóa, chẳng hạn như SAT, BAR và GRE mà không cần đào tạo cụ thể. GTP-4 không chỉ hiểu và giải quyết các bài kiểm tra này với số điểm tương đối cao mà còn đánh bại người tiền nhiệm của nó, GPT-3.5.
2.2 Khả Năng Chấp Nhận Đa phương Thức
Phiên bản trước của ChatGPT chỉ giới hạn ở các lời nhắc bằng văn bản. Ngược lại, một trong những tính năng mới nhất của GPT-4 là khả năng đa phương thức của nó. Mô hình có thể chấp nhận cả lời nhắc bằng văn bản và hình ảnh. Điều này có nghĩa là AI có thể chấp nhận hình ảnh làm đầu vào và diễn giải cũng như hiểu nó giống như lời nhắc văn bản. Khả năng này mở rộng tất cả các kích cỡ và loại hình ảnh và văn bản, bao gồm các tài liệu kết hợp cả hai, bản phác thảo vẽ tay và thậm chí cả ảnh chụp màn hình.
Tuy nhiên, khả năng đọc hình ảnh của GPT-4 không chỉ đơn giản là diễn giải chúng. OpenAI đã giới thiệu điều này trong luồng dành cho nhà phát triển của mình (ở trên), nơi họ cung cấp cho GPT-4 một bản mô phỏng vẽ tay của một trang web trò đùa. Người mẫu được giao nhiệm vụ viết mã HTML và JavaScript để biến mô hình mô phỏng thành một trang web đồng thời thay thế những câu chuyện cười bằng những câu chuyện thực tế. GPT-4 đã viết mã trong khi sử dụng bố cục được chỉ định trong mô hình. Sau khi thử nghiệm, đoạn mã này đã tạo ra một trang web hoạt động với, như bạn có thể đoán, là những trò đùa thực tế. Điều đó có nghĩa là những tiến bộ của AI sẽ có nghĩa là sự kết thúc của lập trình? Không hoàn toàn, nhưng nó vẫn là một tính năng hữu ích trong việc hỗ trợ các lập trình viên.
2.3 Hiệu Suất Vượt Trội Với ChatGPT Hiện Tại
- GPT-4 có khả năng lập trình bằng nhiều loại ngôn ngữ khác nhau, tạo kịch bản nội dung tùy theo yêu cầu, trả lời câu hỏi phức tạp cũng như tương tác với hình ảnh – yếu tố còn thiếu trên GPT-3.5 đang được tích hợp trong ChatGPT.
- Ngoài ra, GPT-4 có thể đạt 1.410 điểm trong kỳ thi SAT – một trong những kỳ thi chuẩn hóa cho việc đăng ký vào một số đại học tại Mỹ; đạt 4 hoặc 5 trong thang điểm 5 của các kỳ thi nâng cao (AP) ở các bộ môn Lịch sử Nghệ thuật, Sinh học, Giải tích và Hóa học – số điểm đủ cao để nhận được tín chỉ đại học.
- AI mới đã đánh bại 90% số người tham gia để vượt qua kỳ thi sát hạch trở thành luật sư, đánh bại 99% học sinh thi Olympic Sinh học. Nó cũng đạt điểm cao nhất trong ít nhất 34 bài kiểm tra khác nhau trong các lĩnh vực như kinh tế vĩ mô, viết bài, toán học hay thậm chí nội dung về nghiên cứu rượu vang.
2.4 Khả Năng Điều Khiển Linh Hoạt
Theo OpenAI: “Chúng tôi đang nghiên cứu từng khía cạnh của kế hoạch được nêu trong bài đăng của chúng tôi về việc xác định hành vi của AI, bao gồm cả khả năng điều khiển. Thay vì tính cách ChatGPT cổ điển với độ dài, giọng điệu và phong cách cố định, các nhà phát triển (và sắp tới là người dùng ChatGPT) giờ đây có thể quy định phong cách và nhiệm vụ AI của họ bằng cách mô tả các hướng đó trong thông báo “hệ thống”. Thông báo hệ thống cho phép người dùng API tùy chỉnh đáng kể trải nghiệm người dùng của họ trong giới hạn. Chúng tôi sẽ tiếp tục cải tiến ở đây (và đặc biệt biết rằng thông báo hệ thống là cách dễ nhất để “bẻ khóa” mô hình hiện tại, tức là việc tuân thủ các giới hạn không hoàn hảo), nhưng chúng tôi khuyến khích bạn dùng thử và cho chúng tôi biết điều gì bạn nghĩ.”
3. Hạn Chế Của GPT-4
Dù có nhiều tính năng được nâng cấp vượt bậc, GPT-4 vẫn có những hạn chế tương tự như các mẫu GPT trước đó. Quan trọng nhất, nguồn dữ liệu và độ chính xác trong các câu trả lời của nó vẫn chưa hoàn toàn đáng tin cậy (nó “gây ảo giác” và “hoang mang” cho các sự kiện và đưa ra các lỗi lập luận). Cần hết sức cẩn thận khi sử dụng các kết quả của mô hình ngôn ngữ này, đặc biệt là trong các ngữ cảnh có mức độ rủi ro cao, với giao thức cần có độ chính xác (chẳng hạn như đánh giá của con người, tiếp cận với ngữ cảnh bổ sung hoặc tránh hoàn toàn việc sử dụng mức độ rủi ro cao) .
Mặc dù vẫn là một vấn đề thực sự, nhưng GPT-4 giảm đáng kể độ sai sót so với các mẫu GPT trước đó (bản thân chúng đã được cải thiện sau mỗi lần lặp lại). Điểm GPT-4 cao hơn 40% so với GPT-3.5 mới nhất trong các đánh giá tính xác thực đối nghịch nội bộ của OpenAI: