HelixLab

HelixLab

Share

Trang chia sẻ về Nghiên cứu, Tư vấn và Đào tạo của HelixLab

20/02/2023

Một tuần với ChatGPT

ChatGPT đã tạo ra một cơn sốt thực sự về những gì AI có thể làm được, khi có khả năng tạo ra một văn bản rất giống với cách viết của con người. Trong tuần này, HelixLab sẽ lần lượt đăng bài về ChatGPT để mọi người hiểu hơn về Chatbot, gần như đã vượt qua được Turing test.

Bắt đầu với một số điều có thể bạn đã biết:
1. ChatGPT là một Chatbot kiểu Biết Tuốt có khả năng trả lời mọi câu hỏi dù chỉ đơn giản là trả lời: Tôi không biết. Nhưng cũng chính vì thế nên ChatGPT khá nghiêm túc và không biết hài hước như SimSimi.

2. Chính vì khả năng trên mà Google đã phải náo động khi ChatGPT ra đời, thử suy nghĩ nếu ngày kia chúng ta không truy cập Google để tìm kiếm nữa mà chỉ vào ChatGPT để hỏi thông tin thì Google sẽ lấy tiền quảng cáo ở đâu?

3. Dĩ nhiên là Google chưa thể suy sụp ngay vì hệ sinh thái của Google đâu chỉ có Google Search, họ còn có Android. Nhưng một tin không vui, Alphabet công ty mẹ của Google mới bay nhanh 100 tỷ đô-la vốn hóa vì Bard (Chatbot AI của Google đối thủ của ChatGPT) trả lời sai 1 câu hỏi.

4. Và khi Google Search đang lo sốt vó, thì đối thủ của họ, Bing Search lại đầy sinh khí khi tung ra Bing Chat (dựa trên nhân ChatGPT). Tại sao Bing lại được dùng nhân ChatGPT, vì Microsoft chủ của Bing chính là đơn vị đã tài trợ cho OpenAI - người tạo ra ChatGPT, có ước tính là 29 tỷ đô-la. Sắp tới Word, Excel, PowerPoint có thể tích hợp luôn ChatGPT ấy chứ.

5. Tuy nhiên việc tích hợp ChatGPT vào Microsoft Office có thể chỉ dành cho Office 365 trên Cloud, vì ChatGPT để vận hành được cần một máy tính rất mạnh, và hiện tại ChatGPT đang được vận hành trên Azure (Cloud của Microsoft).

6. Theo ước tính ChatGPT có khoảng 175 tỷ tham số (Để so sánh não người có khoảng 100 tỷ nơ-rôn thần kinh). Nếu sử dụng GPU NVIDIA A100, để ChatGPT sinh ra một từ (khi trả lời câu hỏi) mất khoảng 350ms. Và cứ thế ước tính giá của Azure thì dự đoán chi phí chạy ChatGPT mỗi ngày cần 100k đô-la (con số có thể còn lớn hơn khi số câu hỏi gửi đến ChatGPT ngày càng nhiều).

7. Để huấn luyện ChatGPT với 175 tỷ tham số như thế thì cũng cần một số lượng khổng lồ dữ liệu đầu vào, với khoảng 500 tỷ từ. Để so sánh nếu mỗi phút ta đọc 250 từ, một ngày 8 tiếng không nghỉ ngày nào thì ta cần 11 nghìn năm để đọc hết đống dữ liệu đó, chưa nói việc đọc xong có nhớ được không như ChatGPT.

8. Dù tạo được văn bản rất mượt mà, nhưng ChatGPT lại không phải là trí tuệ - theo nghĩa có khả năng Tư duy. Về bản chất ChatGPT chỉ là "người" ghi nhớ nhiều thông tin.

08/06/2022

Helix có nghĩa là vòng xoắn ốc, HelixLab được ra đời với mong muốn của những người sáng lập đó là góp một phần nhỏ bé vào quá trình Chuyển đổi Số (Digital Transformation). Mọi sự chuyển đổi đều không dễ dàng, trước tiên là chuyển đổi từ chính trong mỗi người, sau đó là chuyển đổi của từng đơn vị phòng ban và đến cả doanh nghiệp. Quá trình đó như đường xoắn ốc, lặp đi lặp lại nhưng mỗi lần lại phát triển hơn và hoàn thiện hơn. Và HelixLab mong muốn được đồng hành cùng các bạn trong quá trình chuyển đổi thành một Data Scientist, thông qua 3 quá trình đầu tiên:
1. Head First: Tạo ra tư duy ban đầu về lập trình, dữ liệu
2. Dive into: Nghiền ngẫm, nghiên cứu và hiểu sâu hơn về dữ liệu
3. Transformation: Thực sự có đủ kiến thức, kỹ năng để biến dữ liệu thành thông tin và ứng dụng vào công việc

Cảm ơn các bạn đã đọc những chia sẻ của chúng tôi! Hi vọng chúng ta có thể đồng hành cùng nhau.

Want your school to be the top-listed School/college in Hanoi?

Click here to claim your Sponsored Listing.

Location

Website

Address

Hanoi