Thứ Bảy, 29 tháng 2, 2020

Xác suất và thống kê trong Truyện Kiều

Bài viết này sẽ viết dần theo năm tháng tuỳ theo thời gian rảnh rỗi của tác giả. Độc giả có thể đọc ở đây chữ Nôm, chữ Hán và thống kê

Trong Truyện Kiều có bao nhiêu chữ Nôm, chữ nào tần số xuất hiện nhiều nhất?


Trả lời: Trong Truyện Kiều có 2747 chữ Nôm, nếu đọc được hết 2747 chữ này kho từ vựng chữ Nôm của các bạn đủ lớn để đọc được các văn bản chữ Nôm khác.

Chữ xuất hiện nhiều nhất là chữ "một" (số 1) có 320 lần xuất hiện với xác suất 0,116 và chữ "mốt" có 1 lần xuất hiện. Điều này tạm hiểu là trung bình cứ đọc 116 chữ Nôm ta gặp 1 chữ "một". Biến dạng của chữ "một" là chữ "mốt" (câu 1092: Ngày hai mươi mốt tuất thì phải chăng). Tuy chữ quốc ngữ "một" và "mốt" viết khác nhau, nhưng chữ Nôm dùng một chữ 񠝧


Ví dụ câu Kiều sau đây có chứa chữ "một".


Cỏ non xanh tận chân trời 𦹵𡽫撐羡蹎𡗶
Cành lê trắng điểm một vài bông hoa 梗梨𤽸點񠝧𠄽芃花

Tuy "một vài" không phải là số 1, nhưng chữ nôm vẫn viết là "một".


Lưu ý các bạn: Chữ "một" là chữ Hán và nghĩa hoàn toàn khác. Sư Thiều Chửu giải nghĩa như sau (tôi chọn nghĩa phổ thông):

  1.  Hết. Như một thế 沒世  hết đời.
  2. Không có, chế người không biết chữ gọi là một tự bi 沒字碑  ý nói trong lòng không có một chữ nào, một chữ bẻ đôi còn không biết. 

    Tiếng Trung hiện đại: 没事 (một sự): không có chuyện gì, no problem. 
  3. Mất tích. Như mai một 埋沒  vùi mất, dẫn một 泯沒  tan mất, v.v.

Không có nhận xét nào:

Đăng nhận xét