Bach's Language Classes

Bach's Language Classes

Share

Language and Cognition

10/05/2025

Bạn đang học ngôn ngữ mới nhưng quá lười tổng hợp và tra cứu từ vựng? Đừng lo, vì mình đã có giải pháp (do bản thân cũng thế).
https://github.com/phantatbach/Vocab-Learning
Code này sẽ làm hộ các bạn:
- Bịa ra một ví dụ tùy vào trình độ của bạn (có thể điều chỉnh trong câu lệnh).
- Dịch tự động từ và ví dụ đó ra ngôn ngữ bạn muốn (ví dụ tiếng Hà Lan -> tiếng Anh)
Bạn sẽ cần chuẩn bị:
- 1 file với 1 cột danh sách từ mới dưới dạng .csv, nhớ đặt tên cột là
'Vocab'.
- Tên ngôn ngữ bạn đang học (ví dụ: nl)
- Tên ngôn ngữ bạn muốn dịch (ví dụ: en)
- Câu lệnh để nhờ AI bịa ví dụ, nhớ có {word} vì code sẽ gửi từng từ lên (ví dụ: "Geef één eenvoudig voorbeeldzin in het Nederlands voor het woord '{word}'. De zin moet geschikt zijn voor een A1-A2 taalniveau. De zin moet het woord '{word}' bevatten.")
- API của Google Gemini (miễn phí)
- Tên model (ví dụ: gemini-1.5-flash)
Sau này, khi có thêm từ mới, bạn chỉ cần gõ thêm ở cột 'Vocab' và nó sẽ tự động xử lí tiếp.
Lưu ý: Nó chỉ giúp các bạn tổng hợp từ mới, việc học và sử dụng vẫn là do các bạn. Nếu các bạn không chịu học mà đòi có ăn thì chỉ có ăn *** ****, ăn ***.

02/04/2025

Viruss, Pháo và tư duy

Trong con mắt của nhiều người, phiên livestream giữa Viruss và Pháo có lẽ chỉ như bao phiên điều trần, bóc phốt khác. Tuy nhiên nếu ngẫm nghĩ kĩ, ta có thể nhìn ra nhiều điều thú vị hơn thế.

Viruss cho rằng vì anh ta chưa nói lời yêu nên chưa yêu chính thức, chưa yêu chính thức nên không có rằng buộc, chưa có rằng buộc nên không phải ngoại tình. Vì suy luận giữa các bước là luôn đúng nên đây là kiểu lập luận suy diễn (deductive reasoning), một cách thức lập luận rất hay được sử dụng.

Pháo lại cho rằng Viruss ngoại tình. Lập luận của Pháo như sau: 'Viruss đã có những cử chỉ gần gũi cả về thể xác lẫn tâm hồn với mình nên anh ta CHẮC CHẮN yêu mình. Mà yêu mình rồi lại còn dây dưa với người khác nên CHẮC CHẮN ngoại tình.' Đây chính là sai lầm của Pháo, khi áp dụng lập luận suy diễn vào trường hợp cần sử dụng quy nạp (inductive reasoning). Trái với suy diễn, các bước suy luận trong quy nạp không có độ chắc chắn tuyệt đối. Nói một cách đơn giản, việc A xảy ra chưa chắc/ có thể/ khả năng cao dẫn tới việc B xảy ra. Trong trường hợp của Pháo, một suy luận hợp lí nên là: 'Viruss đã có những cử chỉ gần gũi cả về thể xác lẫn tâm hồn với mình nên anh ta KHẢ NĂNG CAO là yêu mình.' Bằng cách này, Pháo có thể dễ dàng tránh được việc ngộ nhận.

09/02/2025

[CHUYỆN KHÁM SỨC KHỎE]

Bạn đi khám sức khỏe tổng quát. Một tuần sau nhận kết quả, bạn được chẩn đoán mắc ung thư âm đạo.

‘Bỏ mẹ rồi!’, bạn chửi thầm.

Nhưng rồi bạn thầm nghĩ: ‘Cơ mà nhỡ thiết bị đểu thì sao?’. Ngay lập tức bạn lên Google và nhận ra thiết bị có độ chính xác 99%.

Sau một hồi định thần, bạn nghĩ tiếp: ‘Cơ mà 99% này là kết quả thử nghiệm trên 1 tập nhỏ. Chưa kể ung thư âm đạo cũng rất hiếm gặp, tỷ lệ mắc chỉ có 1%. Nhỡ độ chính xác cao là bởi trên tập đó toàn đứa mắc nên máy báo mắc thì sao?’

Bạn nhớ đến công thức Bayes, sau một hồi tra cứu và tính toán, bạn ra được công thức tính khả năng mắc bệnh nếu kết quả dương tính là:
P(Bệnh | Dương tính) = P(Dương tính | Bệnh) * P(Bệnh) / P(Dương tính) = 0.99 * 0.01 / 0.0198 = 0.5

‘Ồ, thì ra khả năng mắc bệnh cũng chỉ là 50%. Chắc phải đi khám lại cho chắc.’ bạn thở phào. Nhưng rồi, bạn nhớ ra 1 việc. Bạn là nam thì làm quái gì có âm đạo mà mắc ung thư. Sư cha đứa nào nhập sai kết quả.

Hôm sau bạn nhận được email xin lỗi từ bệnh viện cùng với kết quả chuẩn. Và lần này bạn được chẩn đoán mắc ung thư dương vật.

‘Bỏ mẹ rồi!’, bạn chửi thầm.

23/01/2025

Levels of knowledge

Đã bao giờ bạn bị choáng ngợp bởi các công thức Toán học chưa? Đã bao giờ bạn làm bài tập rất nhanh nhưng không biết cách áp dụng thực tế chưa? Nếu bạn rơi vào 1 trong 2 trường hợp trên thì ‘do bạn không chơi đồ đấy bạn ạ.’ (Bảnh, 2020).

Ta có thể nhìn kiến thức dưới 2 góc độ: High-level và Low-level.
High-level tức ta nhìn vào bức tranh lớn hơn, bỏ qua các chi tiết rườm rà.

Ví dụ: Differential Calculus mô tả sự thay đổi của f(x) khi ta thay đổi biến x. Ví dụ: Nếu x thay đổi 1 (hoặc 2, 3, 4) đơn vị thì f(x) sẽ thay đổi như thế nào? Và khi sự thay đổi của x là rất rất nhỏ (gần như bằng 0) thì f(x) sẽ thay đổi như thế nào?

Low-level tức ta sẽ cần zoom in hay nhìn vào các chi tiết của phần kiến thức đó. Lúc này ta sẽ gặp các công thức phức tạp hơn.

Ví dụ: Đây sẽ là các công thức như nếu f(x) = 2x thì f’(x) = 2

Việc hiểu được cả high-level và low-level sẽ giúp các bạn biết được phần kiến thức đó có vai trò gì trong một bức tranh tổng thể và công thức được hình thành như thế nào.

Từng có 1 bạn nhờ mình nhận xét đề cương nghiên cứu. Bạn ý liệt kê ra khoảng 10 phép thử thống kê (statistical test) nhưng không thể trả lời được lí do cho việc sử dụng chúng (high level) khi được mình hỏi. Mình nghĩ rằng nếu lúc đó, mình hỏi sâu hơn về từng công thức (low level) thì chắc bạn ý cũng chịu nốt.

Trong quá trình làm luận văn thạc sĩ, mình cũng từng rất trăn trở, muốn luận văn phải thật xịn, thật phức tạp nhưng cuối cùng thì phần phương pháp nghiên cứu của mình rất đơn giản. Lí do mình được 80 điểm và là sinh viên đầu tiên trong lịch sử của khoa giành giải luận văn xuất sắc có lẽ đơn giản là vì mình ‘làm chủ’ được kiến thức ở cả high và low level, tức biết lúc nào cần dùng gì và dùng như thế nào, thay vì quá sa đà vào việc phải dùng các kĩ thuật thật phức tạp.

Từng là 1 người rất ‘vô học’, sau này mình đã phải (tự) học rất nhiều để có thể chuyển hướng sang khoa học dữ liệu. Việc hiểu được high và low level giúp mình biết lúc nào cần học gì, lúc nào cần đi nhanh và lúc nào cần đi sâu.

Photos from Bach's Language Classes's post 31/10/2024

Tổng hợp Full HD có che bộ hồ sơ PhD của mình.

Bạn nào hứng thú thì có thể tự đọc và so sánh rồi rút ra các bài học cho riêng mình. Hi vọng sẽ giúp được các bạn có dự định đi làm Tiến Sĩ ở châu Âu.

Lưu ý: Mình đã bỏ bớt các thông tin quá học thuật, hàn lâm và thông tin cá nhân.

28/09/2024

Underlying dimension of semantic change

Được một hôm tương đối rảnh rỗi nên chia sẻ nhanh về chủ đề mình đang làm.

Chúng ta đều biết rằng ngôn ngữ, đặc biệt là ngữ nghĩa của từ luôn có sự thay đổi, vậy làm thế nào để ta nhận ra sự thay đổi đó?

Cách đơn giản nhất là ta tra từ điểm ở các thời điểm ta muốn so sánh, tuy nhiên cách này không uy tín cho lắm vì mỗi từ điển có thể định nghĩa 1 kiểu khác nhau, chưa kể cách hiểu của mọi người cũng có thể khác so với cách mà từ điển định nghĩa. Và không phải thời đại nào cũng có từ điển để tra cứu.

Một cách nữa là đi hỏi những người ở các thế hệ khác nhau và so sánh cách hiểu của họ về một (số) từ nào đó. Tuy nhiên đôi khi sự khác nhau giữa các cách hiểu mang tính cá nhân chứ không phải mang tính thế hệ, tức 2 người ở cùng 1 thế hệ cũng có thể hiểu khác nhau. Để khắc phục vấn đề này, ta có thể hỏi nhiều người hơn. Tuy nhiên làm như vậy cũng rất mất công vì ta phải đảm bảo rằng các yếu tố khác như vùng miền, trình độ học vấn, vv là tương đối giống nhau. Và ta cũng không thể tìm ra được sự thay đổi cách quá 100 năm (tức 1 đời người) và kể cả nếu ta có muốn rút ngắn lại thì chưa chắc những người ở thế hệ trước đã còn để mà hỏi.

Thật may mắn là chúng ta lưu giữ rất nhiều các tài liệu, văn bản từ hang trăm năm trước. Và với thời đại 4.0 hiện nay thì việc thu thập dữ liệu của ngôn ngữ hiện đại dễ hơn bao giờ hết. Nếu ta tạm giả sử ngôn ngữ được sử dụng trong những tài liệu này đại diện cho ngôn ngữ chung của thời điểm chúng được viết ra (tất nhiên còn nhiều yếu tố khác nữa nhưng ta không bàn đến ở đây) thì ta có thể dễ dàng so sánh được bằng cách so sánh 2 khối ngữ liệu này.

Vậy là ta đã xong phàn dữ liệu, tiếp đến là phần phân tích.

Làm thế nào để ta xác định nghĩa của một từ mà không dựa vào từ điển (vì những lí do ở trên)? Theo distributional semantics, ta có thể hiểu nghĩa của một từ dựa vào những từ đi kèm với nó. Ví dụ, thay vì việc phải dùng định nghĩa như: ‘Bách: Một người đẹp trai thông minh’ thì ta có thể xem Bách thường xuất hiện trong những ngữ cảnh nào. Ví dụ:
• Hôm qua em gặp anh Bách ở trên LAB, thấy anh ý NGẦU lắm. (2024)
• Bách mới DEBUG xong một đống CODE. (2024)
• Và người nhận GIẢI LUẬN VĂN XUẤT SẮC NHẤT … là Bách. (2022)

Thông qua việc phân tích như thế này, ta có thể dễ dàng so sánh ngữ cảnh của 1 từ ở 2 thời điểm khác nhau để tìm thấy sự thay đổi về ngữ nghĩa. Nếu như mình cho các bạn thêm 3 ví dụ từ 2017 thì các bạn có thấy sự thay đổi nào không?
• Thằng Bách lại BÙNG HỌC ĐI TẬP RỒI. (2017)
• Hôm qua thấy Bách SQUAT 190kg không đai chất vcl. (2017)
• Tí thì bị Bách TAKE DOWN, may mà PULL GUARD kịp. (2017)

Nếu bạn có thể thấy và hiểu được sự thay đổi thì xin chúc mừng, bạn đủ điều kiện để trờ thành 1 nghiên cứu sinh trong dự án của mình.

Tuy nhiên đời không như mơ, và không phải lúc nào 1 luận án Tiến Sĩ cũng dễ ăn như vậy. Đôi khi chúng ta sẽ thu thập được 1 đống các ngữ cảnh khác nhau và không thể suy ra được sự thay đổi một cách rõ ràng. Ví dụ, nếu như ta coi ngữ cảnh ở đây là những người mà Bách chơi cùng.
• Hùng, Linh, Mạnh (2017)
• Thắng, Dũng, Quân (2022)

Có thể thấy rằng đã có sự thay đổi, nhưng cụ thể là thay đổi như thế nào? Tại sao? Lúc này, ta phải phân tích tiếp ngữ cảnh đó, để tìm ra chiều ẩn (underlying dimensions). Nếu như ta phân tích bài hát mà họ thích, ta có:
• Hùng: EDM, Pop, Rap
• Linh: Jack 5 củ, Sếp
• Mạnh: Rock, Rap
• Thắng: Opera, Pop
• Dũng: Tiền chiến, Cách mạng
• Quân: Opera, Rock

Từ phân tích trên, ta có thể đưa ra giả thuyết rằng Bách đã thay đổi và có sự thay đổi này vì gu âm nhạc của Bách đã thay đổi. Tuy nhiên đây chỉ là một chiều, nếu ta phân tích theo môn thể thao, món ăn ưa thích, vv thì có thể suy ra nhiều thứ khác nữa. Trên lí thuyết, ta có thể đi sâu hơn nữa với các chiều ẩn. Tuy nhiên ta sẽ gặp 1 số vấn đề.
• Càng đi sâu vào chiều ẩn thì sẽ càng khó giải thích.
• Lượng từ vựng trong ngôn ngữ là có hạn, đến một chiều ẩn nào đó thì tất cả từ vựng sẽ liên kết với nhau và việc phân tích trở nên vô nghĩa (xem ảnh).

05/07/2024

Một bạn lớp 12 đã đủ điểm xét tuyển đại học.

(Mình chỉ dám nhận công cho kĩ năng viết)

23/04/2024

Tập tành làm supervisor tiếp. Lần này vẫn là cho 1 bạn học TESOL ở Anh.
Để xem có được Distinction nữa không =)))

16/04/2024

'Học sinh' được chữa writing free nhiều nhất của mình. Đã chữa free rồi còn hay gửi bài vào nửa đêm.

Sau này phải bắt đóng tiền học mấy buổi Speaking/ Vocal để sửa bớt cái giọng Ca Li Phèn Nia A.

13/04/2024

Học sinh ôn được 5 buổi (W,S) xong nghỉ hẳn 1 tháng để tự ôn (L, R) rồi ôn tiếp 2 buổi vì thi gấp =)))

Chắc phải mở thêm lớp Reading quá =)))

21/01/2024

Một bạn đã chuẩn bị đi Mỹ rồi. Quả là không bõ công chửi.

Không biết bên Mỹ có món gì ngon (và đắt) để bảo nó mua nhỉ?

06/12/2023

Kể từ hồi nộp luận văn Thạc Sĩ là mình bỏ hẳn việc viết lách. Đa phần thời gian dành cho việc đọc báo khoa học, sách chuyên ngành, xem bài giảng. Thi thoảng có người nhờ thì mình mới ngồi sửa bài viết.

Hôm trước có gặp phải cái đề liên quan đến đạo đức nên viết thử một đoạn, thấy cũng không xuống cấp lắm.

'Advocates of international aid contend that nations bear a moral responsibility to support one another, particularly in situations involving humanitarian crises and poverty alleviation. What needs clarification here is the underlying principles of moral obligation that drive their argument. Many proponents refer to the works of philosophers like Bach and Bach, who asserted that assisting others is an inherent aspect of human morality. To put it simply, these moral obligations are innate to our nature. Those who adopt a societal perspective argue that our moral framework is shaped by society. This means that as members of a community, we are expected to align our actions with societal norms, which often include acts of kindness such as helping others. In other words, it is our duty to adhere to these expectations as our societies are built upon such virtues and values. The world could then be considered a big societies with nations as its citizens, and therefore, international aid is the responsibility of all nations.'

Want your school to be the top-listed School/college in Hanoi?

Click here to claim your Sponsored Listing.

Location

Category

Address


Hanoi
100000