Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Chữ Nôm & IT (in VNese)

19b71a1439f21761f993da78fd46eaf2?s=47 jdo
November 24, 2012

Chữ Nôm & IT (in VNese)

A talk at the General Sciences Library HCMC on Vietnam Cultural Heritage Day (2012-11-23)

19b71a1439f21761f993da78fd46eaf2?s=128

jdo

November 24, 2012
Tweet

Other Decks in Education

Transcript

  1. ᄺ  &  CNTT Đỗ  Bá  Phước  [ై  ഢ  ෱] HCMC

     2012-­‐11-­‐23 1 1
  2. •Thử  thách:  Đọc  &  hiểu  chữ  Nôm •Phát  triển:  Mã

     hoá  chữ  Nôm  trong  máy   Fnh •Giải  pháp:  Máy  Fnh  giúp  con  người Nội  dung 2 2
  3. 3 In  ấn 3

  4. •ISO/IEC:  tổ  chức  quốc  tế •Unicode:  tổ  chức  công  nghiệp

    •TCVN/JTC1:  tổ  chức  quốc  gia •TCVN  5773:1993  &  6056:1995 •TCVN  8271:2011  (LaUn,  Khmer,   Chăm,  Thái,  Nôm)   •1993:  ISO  10646/Unicode  được   thông  qua,  chấp  nhận  chữ  Nôm Chuẩn  hoá  chữ  viết TCVN JTC1 4 4
  5. •CJKV:  Chinese-­‐Japanese-­‐Korean-­‐ Vietnamese •2012:  74,617  ký  tự  biểu  ý  thống

      nhất  (CJK  Unified  Ideographs) •10,085  chữ  Nôm •Các  máy  vi  Fnh  (Windows,  OS  X)   và  điện  thoại  di  động  (iOS)  hỗ  trợ   Unicode  (và  có  sẵn  chữ  Nôm) TCVN JTC1 CJKV  và  chữ  Nôm 5 5
  6. 6 6

  7. 7 Nhập  liệu  thủ  công 7

  8. 8 Chữ  Nôm  trong  iPhone 8

  9. •Thư  viện  Quốc  gia  và  Hội  Bảo   tồn  Di

     sản  Nôm:  số  hoá  sách •Thư  viện  Khoa  học  Tổng  hợp   TpHCM:  số  hoá  tài  liệu  ở  Huế,   các  tỉnh  miền  Trung  và  miền  Tây •Hội  Bảo  tồn  Di  sản  Nôm:  số  hoá   các  bản  Kiều •“Số  hoá”  =  quét  tài  liệu  [scan] “Số  hoá”  chữ  Nôm 9 9
  10. 10 ? Bước  cuối  cùng 10

  11. Nhận  dạng  chữ  Nôm 11 11

  12. •2001:  IBM  InfoScope  nhận  dạng   chữ  Hoa,  và  dịch

     trên  máy  Fnh   cằm  tay  và  thông  qua  máy  chủ •2011:  WordLens  trên  iPhone,  nhận   dạng  chữ  LaUn,  và  dịch  trên  máy •2012:  Tesseract-­‐OCR  và  VietOCR   mã  nguồn  mỡ •“Số  hoá”  =  nhận  dạng  chữ  [opUcal   character  recogniUon  (OCR)] “Số  hoá”  chữ 12 12
  13. Nhận  dạng  &  thông  dịch 2001 2011 13 13

  14. Nhận  dạng  trực  rếp 14 14

  15. Mục  rêu •Thực  hiện  nhận  dạng  chữ  Nôm •OCRNôm  trên

     máy  vi  Fnh:  Windows,   Mac,  Linux •NômScope  trên  điện  thoại  thông  minh:   iOS,  Android 15 15
  16. Chuẩn  hoá 16 16

  17. Cơ  hội  mới  với  dữ  liệu  số  hoá •Tìm  kiếm,

     tra  cứu  [search] •Phát  âm  [text-­‐to-­‐speech  (TTS)],   đọc  cho  người  mù •In  ấn,  nghệ  thuật  [typography,   arts] •Đối  chiếu,  chuẩn  hoá  chữ  Nôm   [unificaUon,  standardizaUon] •... 17 17
  18. Kết  luận •Yếu  tố  con  người  vẫn  rất  quan  trọng

    •Máy  Fnh  chỉ  có  thể  giải  quyết  một  phần  (có   thể  một  phần  lớn)  của  vấn  đề  đọc  chữ  Nôm •Cần  giải  quyết  bước  số  hoá  còn  lại,  nối   công  nghệ  thông  Un  với  di  sản  quý  báu 18 18
  19. • h’p://nomfoundaUon.org/nom-­‐tools/Nom-­‐Lookup-­‐Tool • h’p://nomfoundaUon.org/nom-­‐tools/Nom-­‐Font • h’p://unicode.org/charts/unihan.html Tham  khảo 19 19

  20. Cảm  ơn 20 20