Làm thế nào để đổi Font chữ trong file sau (1 người xem)

vanle33 · 19/11/12

Em có down về 1 bản giá như sau
Không hiểu font chữ trong đó là font gì mà có rất nhiều ký tự lạ. Mong các bạn chuyển toàn bộ các dữ liệu ở cột A về font Times news roman hoặc VnTime
Thanks!

ndu96081631 · 19/11/12

vanle33 đã viết:
Em có down về 1 bản giá như sau
Không hiểu font chữ trong đó là font gì mà có rất nhiều ký tự lạ. Mong các bạn chuyển toàn bộ các dữ liệu ở cột A về font Times news roman hoặc VnTime
Thanks!

Bạn dùng Unikey với mã nguồn là UTF-8 và đích là Unicode thử xem

vanle33 · 19/11/12

ndu96081631 đã viết:
Bạn dùng Unikey với mã nguồn là UTF-8 và đích là Unicode thử xem

Hay qúa . Ok rồi bác ah
Em đang định chuyển toàn bộ hàng thành cột
Sau khi copy lại thì tự chuyển thành các cột rồi. Đúng là 1 công đôi việc. hiii
Đó là mã nguồn gì đó bác? Em chưa hiểu về mã đó lắm

ndu96081631 · 19/11/12

vanle33 đã viết:
Hay qúa . Ok rồi bác ah
Em đang định chuyển toàn bộ hàng thành cột
Sau khi copy lại thì tự chuyển thành các cột rồi. Đúng là 1 công đôi việc. hiii
Đó là mã nguồn gì đó bác? Em chưa hiểu về mã đó lắm

Ai mà biết đâu nè. Cứ mở Unikey lên, thử từng em đến khi được thì thôi
Nhưng thường thì với file csv, tôi để ý thấy nếu người ta muốn hiển thị tiếng Việt có dấu thì người ta sẽ Save kiểu UTF-8
Vậy, ta cũng có cách chuyển đổi mà không cần đến Unikey:
- Mở file csv bằng Notepad
- Save As kiểu Unicode
- Xong, mở Excel, import file csv đã save Unicode khi nãy vào

dmtcvn · 19/11/12

Tôi cho là có thể UTF-8 nhưng chuyển đổi thử thì còn một số từ không đúng có thể tác giả khi đánh fon không thống nhất.

vanle33 · 19/11/12

ndu96081631 đã viết:
Ai mà biết đâu nè. Cứ mở Unikey lên, thử từng em đến khi được thì thôi
Nhưng thường thì với file csv, tôi để ý thấy nếu người ta muốn hiển thị tiếng Việt có dấu thì người ta sẽ Save kiểu UTF-8
Vậy, ta cũng có cách chuyển đổi mà không cần đến Unikey:
- Mở file csv bằng Notepad
- Save As kiểu Unicode
- Xong, mở Excel, import file csv đã save Unicode khi nãy vào

1) Sao em không thấy Save as kiểu Unicode sau khi mở file bằng Note Pad nhỉ??
2) em làm theo cách bài #2 của bác thấy có lỗi ở cột B khá nhiều chữ ví dụ : L’ XO QUẢ GA , CHỐT PHAO X‚NG , BÁT PHỐT TRƯšC , NAN HOA TRƯšC CH‚N D€I ....
và còn nhiều chữ khác nữa. Phải sửa thế nào vậy bác?

ndu96081631 · 19/11/12

vanle33 đã viết:
1) Sao em không thấy Save as kiểu Unicode sau khi mở file bằng Note Pad nhỉ??

Xem hình dưới đây nhé:
- Mục Save As Type: chọn All Files
- Mục Encoding: Chọn Unicode

vanle33 · 19/11/12

Em save as được rồi nhưng sao khi mở lại file đó bằng Excel thì các font chữ vẫn bị lỗi???
Có phải open file bình thường không bác? hay import như thế nào ạ?

ndu96081631 · 19/11/12

vanle33 đã viết:
Em save as được rồi nhưng sao khi mở lại file đó bằng Excel thì các font chữ vẫn bị lỗi???
Có phải open file bình thường không bác? hay import như thế nào ạ?

Chán bạn quá! Làm luôn cho bạn đây

vanle33 · 21/11/12

ndu96081631 đã viết:
Làm cho bạn đây

Bác ndu cho em hỏi làm sao xóa dấu nháy trong 1 số Cell ví dụ : '127141860000
Em làm thử theo cách bài #27 http://www.giaiphapexcel.com/forum/showthread.php?71773-Làm-sao-để-xóa-dấu-nháy-trong-Cell/page3
nhưng không được??

ndu96081631 · 21/11/12

vanle33 đã viết:
Bác ndu cho em hỏi làm sao xóa dấu nháy trong 1 số Cell ví dụ : '127141860000
Em làm thử theo cách bài #27 http://www.giaiphapexcel.com/forum/showthread.php?71773-L%C3%A0m-sao-%C4%91%E1%BB%83-x%C3%B3a-d%E1%BA%A5u-nh%C3%A1y-trong-Cell/page3
nhưng không được??

Bạn làm như sau:
- Bôi đen dấu nháy trong cell rồi copy nó
- Xong, chọn nguyên cột A, bấm Ctrl + H
- Paste dấu nháy đã copy vào cả 2 khung Find What và Replace With
- Xong, bấm Replace All
Giờ thì áp dụng được chiêu ở bài #27 rồi đấy

nguyenvanve1985 · 30/9/13

Mình cũng bi tình trạng như vậy nhưng mình đã sửa được font chữ rồi ,nhưng mình lại bị vướng phải vấn đề là số mình tải về lại không tính được

nguyenvanve1985 · 30/9/13

Minh da giai quyet duoc font chu roi nhung minh lai bi loi nhu sau :
[table="width: 96"]
[tr]
[td]253199015.0[/td]
[/tr]
[tr]
[td]204612967.0[/td]
[/tr]
[tr]
[td]13743849.0[/td]
[/tr]
[tr]
[td]23513569.0[/td]
[/tr]
[tr]
[td]314727446.0[/td]
[/tr]
[tr]
[td]359473721.0[/td]
[/tr]
[tr]
[td]352982894.0[/td]
[/tr]
[/table]

so minh tai ve co dinh dang nhu the nay thi khong the tinh toan gi duoc
xin bac hay giup minh voi
thanks !

paulsteigel · 30/9/13

vanle33 đã viết:
1) Sao em không thấy Save as kiểu Unicode sau khi mở file bằng Note Pad nhỉ??
2) em làm theo cách bài #2 của bác thấy có lỗi ở cột B khá nhiều chữ ví dụ : L’ XO QUẢ GA , CHỐT PHAO X‚NG , BÁT PHỐT TRƯšC , NAN HOA TRƯšC CH‚N D€I ....
và còn nhiều chữ khác nữa. Phải sửa thế nào vậy bác?

Bộ mã chuyển đổi Unicode utf-8 của Unikey có một số lỗi. Tôi cũng không hiểu rõ có phải là do cơ chế định nghĩa bộ mã đầu vào của bác Phạm Kim Long bị sai hay không nhưng có một số ký tự đánh dấu bị lầm, đặc biệt là những nguyên âm phức có dấu nặng (ự,ậ, ặ ...vv). Xem hình ảnh kèm theo!
Ví dụ:
Táº¤M Äá»†M thực ra là TẤM ĐỆM và phải có thêm 1 dấu † để đặt dấu nặng trong khi Unikey chỉ dùng á» để thể hiện chữ Ệ
Chính vì mã đầu vào bị sai nên mã đầu ra cũng bị sai khi dùng Unikey để chuyển mã.
Khi tôi dùng Ultraedit để chuyển bộ mã Utf-8 của tiếng Việt cho công cụ chuyển mã thì phát hiện ra sự khác biệt này.
Xin chia sẻ!

vanle33 · 30/9/13

paulsteigel đã viết:
Bộ mã chuyển đổi Unicode utf-8 của Unikey có một số lỗi. Tôi cũng không hiểu rõ có phải là do cơ chế định nghĩa bộ mã đầu vào của bác Phạm Kim Long bị sai hay không nhưng có một số ký tự đánh dấu bị lầm, đặc biệt là những nguyên âm phức có dấu nặng (ự,ậ, ặ ...vv). Xem hình ảnh kèm theo!
Ví dụ:
Táº¤M Äá»†M thực ra là TẤM ĐỆM và phải có thêm 1 dấu † để đặt dấu nặng trong khi Unikey chỉ dùng á» để thể hiện chữ Ệ
Chính vì mã đầu vào bị sai nên mã đầu ra cũng bị sai khi dùng Unikey để chuyển mã.
Khi tôi dùng Ultraedit để chuyển bộ mã Utf-8 của tiếng Việt cho công cụ chuyển mã thì phát hiện ra sự khác biệt này.
Xin chia sẻ!
View attachment 109851

Cám ơn bác, ở topic này em đã có file chuyển được mã đọc được rồi.
Ở trên hình có phải là Chuyển mã về Unicode là không bị lỗi phải không a?
Bác dùng "Công cụ" ở các cột có chữ Công cụ là công cụ (phần mềm) gì đó a? Đường link down của nó chỗ nào vậy bác?
Có một số câu hỏi trên em muốn hỏi bác a.

siwtom · 30/9/13

paulsteigel đã viết:
Bộ mã chuyển đổi Unicode utf-8 của Unikey có một số lỗi. Tôi cũng không hiểu rõ có phải là do cơ chế định nghĩa bộ mã đầu vào của bác Phạm Kim Long bị sai hay không nhưng có một số ký tự đánh dấu bị lầm, đặc biệt là những nguyên âm phức có dấu nặng (ự,ậ, ặ ...vv). Xem hình ảnh kèm theo!
Ví dụ:
Táº¤M Äá»†M thực ra là TẤM ĐỆM và phải có thêm 1 dấu † để đặt dấu nặng trong khi Unikey chỉ dùng á» để thể hiện chữ Ệ
Chính vì mã đầu vào bị sai nên mã đầu ra cũng bị sai khi dùng Unikey để chuyển mã.
Khi tôi dùng Ultraedit để chuyển bộ mã Utf-8 của tiếng Việt cho công cụ chuyển mã thì phát hiện ra sự khác biệt này.
Xin chia sẻ!
View attachment 109851

Theo tôi Unikey không có lỗi.
Nếu bạn thấy lỗi thì nên liệt kê cụ thể từng thao tác mà bạn đã làm thì người khác mới kiểm chứng được. VD. bạn convert memory hay tập tin? Tôi hiểu là bạn copy chuỗi unicode vào bộ nhớ --> dùng Unikey chuyển với nguồn = unicode, đích = UTF-8 --> lại chuyển tiếp cũng memory nhưng với nguồn = UTF-8 (đã có trong bộ nhớ sau lần chuyển 1), đích = unicode (tức không ghi kết quả vào tập tin sau lần convert trước rồi lại "bôi đen" và copy vào bộ nhớ). Nếu thế thì theo tôi sau lần convert thứ 2 ta có lại unicode ban đầu. Tôi đã làm như thế và có unicode ban đầu.

Dùng unikey hay bất cứ code convert nào khác thì đích và nguồn phải đúng thì mới ra kết quả đúng được. Vd. bạn có chuỗi unicode --> bạn copy vào bộ nhớ rồi dùng Unikey chuyển với nguồn = UTF-8, đích = unicode thì Unikey cũng vẫn hiển thị rằng "đã chuyển thành công" nhưng nếu bạn copy kết quả vào Notepad thì bạn có "đầu trâu mặt ngựa". Vì thực ra khi convert thì trong bộ nhớ thực ra bạn có unicode (nguồn = unicode). Nhưng do bạn chọn nguồn = UTF-8 nên Unikey cứ cho đó là UTF-8 và chuyển thành unicode, vậy kết quả sai. Nguồn phải thực sự đúng như là có trong bộ nhớ. Nếu chuyển thấy kết quả sai thì chỉ có thể là ta chọn nguồn là xyz nhưng thực chất trong bộ nhớ không phải là xyz. Thế thôi.

Unikey không có "cơ chế định nghĩa bộ mã đầu vào". Vì vd. TCVN3 thì đúng là mã dùng bởi người Việt chứ UTF-8 và unicode thì đâu có dính dáng gì tới tiếng Việt. Chúng được dùng bởi toàn thế giới mà. Cách chuyển qua lại giữa unicode và UTF-8 có "thuật toán", "qui tắc" được định nghĩa đàng hoàng bởi chuẩn quốc tế.

Trong quá khứ tôi đã từng đọc cách mã UTF-8 nhưng hiện tại không nhớ chỗ nào. Có thể đọc tại

http://en.wikipedia.org/wiki/UTF-8

Việc convert UTF-8 <--> unicode không cần "cơ chế định nghĩa bộ mã đầu vào" vì nó được làm theo qui tắc". Unikey cũng convert dựa vào qui tắc này. Tôi đã đọc mã nguồn của Unikey và thấy đúng như thế.

Nếu đọc tiếng Việt thì vd.

http://www.vovisoft.com/unicode/BasicUnicode.htm

paulsteigel · 30/9/13

Cảm ơn bác Siwtom.
Thực ra bài viết trên em cũng chỉ đoán theo cơ chế vì chưa tự mình giải thích được câu chuyện giống như chủ đề bài này. Có nhiều trường hợp dùng Unikey với Utf-8 thì đều bị lỗi như vậy. Nếu bác thử gõ với điều kiện chuyển bảng mã sang UTF-8 thì cũng gặp điều tương tự.
Ví dụ: nếu chuyển sang dùng UTF-8, em gõ chữ ộ=á», ệ=á» và dùng Unikey chuyển những cái đó ngược lại thành unicode thì không được. Còn một số ít ký tự khác cũng gặp vấn đề tương tự. Tuy nhiên khi dùng Ultra Edit để convert thì lại được - vì thế em mới quy tội cho vụ chuyển bảng mã.

Ví dụ đoạn văn sau, em gõ trong Ultra Edit rồi chuyển sang Utf với công cụ chuyển mã của nó
TẤM NỆM NÀY QUÁ TỆ CẦN PHẢI THAY ĐỔI HỆ THỐNG SẢN XUẤT
Tấm nệm này quá tệ, cần phải thay đổi hệ thống sản xuất

Táº¤M Ná»†M NÃ€Y QUÃ Tá»† Cáº¦N PHáº¢I THAY Äá»”I Há»† THá»NG Sáº¢N XUáº¤T
Táº¥m ná»‡m nÃ y quÃ¡ tá»‡, cáº§n pháº£i thay Ä‘á»•i há»‡ thá»‘ng sáº£n xuáº¥t

Sau đó chuyển ngược, chuyển xuôi đều được nhưng Unikey thì thất bại. Điều đó làm em có suy đoán là bộ chuyển đổi hoặc ít ra thuật toán chuyển đổi có vấn đề, thêm nữa khi gõ bằng Unikey cũng bị tội như thế. Thành ra đó là căn nguyên. Em sẽ thử đọc đoạn code đó của bác Long và phân tích xem thế nào.

Khi lập bảng đầu vào cho công cụ chuyển mã, em thấy vụ này nên đã tự mình bổ sung thêm dấu cho mấy nguyên âm lỗi đó thì lại không bị sao.
Kính bác giải thích giùm cho em và mọi người! Còn về kỹ năng sử dụng bộ chuyển mã của Unikey thì em tin không có vấn đề gì vì em sử dụng nó từ 2002 đến giờ!
Liên kết công cụ ở đây để bạn Văn thử nhé.
http://www.sfdp.net/tai-lieu-khac/bocongcuchuyenma/Functions.rar

siwtom · 1/10/13

paulsteigel đã viết:
Cảm ơn bác Siwtom.
Thực ra bài viết trên em cũng chỉ đoán theo cơ chế vì chưa tự mình giải thích được câu chuyện giống như chủ đề bài này. Có nhiều trường hợp dùng Unikey với Utf-8 thì đều bị lỗi như vậy. Nếu bác thử gõ với điều kiện chuyển bảng mã sang UTF-8 thì cũng gặp điều tương tự.
Ví dụ: nếu chuyển sang dùng UTF-8, em gõ chữ ộ=á», ệ=á» và dùng Unikey chuyển những cái đó ngược lại thành unicode thì không được. Còn một số ít ký tự khác cũng gặp vấn đề tương tự. Tuy nhiên khi dùng Ultra Edit để convert thì lại được - vì thế em mới quy tội cho vụ chuyển bảng mã.

Ví dụ đoạn văn sau, em gõ trong Ultra Edit rồi chuyển sang Utf với công cụ chuyển mã của nó
TẤM NỆM NÀY QUÁ TỆ CẦN PHẢI THAY ĐỔI HỆ THỐNG SẢN XUẤT
Tấm nệm này quá tệ, cần phải thay đổi hệ thống sản xuất

Táº¤M Ná»†M NÃ€Y QUÃ Tá»† Cáº¦N PHáº¢I THAY Äá»”I Há»† THá»NG Sáº¢N XUáº¤T
Táº¥m ná»‡m nÃ y quÃ¡ tá»‡, cáº§n pháº£i thay Ä‘á»•i há»‡ thá»‘ng sáº£n xuáº¥t

Sau đó chuyển ngược, chuyển xuôi đều được nhưng Unikey thì thất bại. Điều đó làm em có suy đoán là bộ chuyển đổi hoặc ít ra thuật toán chuyển đổi có vấn đề, thêm nữa khi gõ bằng Unikey cũng bị tội như thế. Thành ra đó là căn nguyên. Em sẽ thử đọc đoạn code đó của bác Long và phân tích xem thế nào.

Khi lập bảng đầu vào cho công cụ chuyển mã, em thấy vụ này nên đã tự mình bổ sung thêm dấu cho mấy nguyên âm lỗi đó thì lại không bị sao.
Kính bác giải thích giùm cho em và mọi người! Còn về kỹ năng sử dụng bộ chuyển mã của Unikey thì em tin không có vấn đề gì vì em sử dụng nó từ 2002 đến giờ!
Liên kết công cụ ở đây để bạn Văn thử nhé.
http://www.sfdp.net/tai-lieu-khac/bocongcuchuyenma/Functions.rar

Cám ơn bạn đã cho ý kiến.
Trước hết xin lỗi bạn là tôi viết không rõ ràng lắm. Câu "Theo tôi Unikey không có lỗi" có lẽ không chính xác.
Vì ý tôi chỉ là: trong quá trình chuyển đổi utf8 <--> unicode thì theo tôi không có bảng tra nào được dùng. Tuy không biết gì về C++ nhưng xem code của bác Phạm Kim Long thì tôi cảm thấy nó làm theo "qui tắc", "thuật toán" mà tôi nói ở bài #16. Tất nhiên trong bài trên tôi dùng từ "theo tôi", tức đó chỉ là ý kiến cá nhân chứ không phải "chân lý".

Có một điều lạ mà bây giờ kiểm tra kỹ tôi mới thấy.
1. Nếu tôi copy đoạn text unicode trong bài của bạn --> dùng Unikey với nguồn = unicode, đích = UTF-8 --> dùng Unikey lần nữa với nguồn = UTF-8 (vì theo tôi hiện thời trong bộ nhớ có UTF-8 là kết quả của lần convert vừa rồi. Có thể dán vào Notepad, ghi lại rồi kiểm tra bằng HexEditor thì rõ ràng nó không phải là unicode. Đây là để biết là Unikey có thao tác chứ không phải là trong bộ nhớ vẫn có unicode do copy text của bạn vào), đích = unicode --> mở Notepad --> dán từ bộ nhớ vào Notepad. Sau các thao tác như trên thì trong Notepad có text unicode với nội dung như là text của bạn trên GPE.

2. Nếu sau lần convert đầu tiên tôi thao tác như sau: mở Notepad --> dán vào Notepad --> ghi lại với tên vd. "c:\utf-8.txt" --> đóng Notepad --> mở "c:\utf-8.txt --> copy vào bộ nhớ --> dùng Unikey với nguồn = UTF-8, đích = unicode --> mở Notepad --> dán từ bộ nhớ vào Notepad. Sau các thao tác như trên thì trong Notepad KHÔNG CÓ text unicode với nội dung như là text của bạn trên GPE

Tôi không hiểu cái lạ ở trên.

Đấy là chuyện convert utf-8 <--> unicode. Còn về bản thân Unikey thì câu "Theo tôi Unikey không có lỗi" là sai. Tôi có nhiều lần muốn viết text Windows 1258, rõ ràng chọn rồi nhưng không gõ được text Windows 1258. Nhiều khi phải chọn cái khác rồi chọn lại Windows 1258 thì mới gõ được. Rồi nhiều khi Unikey có lỗi do có xung đột nào đó.

Tóm lại về bản thân Unikey thì tôi cũng không tin tưởng. Có một điều tôi chắc chắn là để convert qua lại unicode <--> utf8 thì người ta dùng "thuật toán" chứ không có bảng tra nào cả. Vì chuyển qua lại như thế có dính dáng gì tới tiếng Việt đâu. Chả nhẽ anh Việt làm bảng tra cho tiếng Việt, anh X, Y, Z làm bảng tra cho X, Y, Z??? Trong khi cách thức encoding UTF-8 là có chuẩn đàng hoàng.

Bản thân tôi trong 99% trường hợp tôi không dùng Unikey. Hàng ngày tôi dùng bàn phím của Windows để viết mọi văn bản.

paulsteigel · 1/10/13

Sau khi nghiên cứu code chuyển đổi của bác Long, thực tế em thấy là Unikey đúng là không sai gì cả, các giả định trước đây về vấn đề của Unikey liên quan đến Utf-8 đều không đúng nhưng em phát hiện ra một điểm lý thú:
Nếu dùng bộ gõ Unikey chuyển sang bảng mã UTF-8 Literal, một số ký tự sẽ không hiển thị được.
Ví dụ khi gõ chữ Ệ thì trên màn hình soạn thảo hiển thị là "á»". Trên thực tế, đoạn ký tự này gồm 3 ký tự với mã ASCII lần lượt là 225, 187 và 134.
Điều đặc biệt ở đây là: Ký tự số 134 không hiển thị ra nhưng khi dùng hàm Char trong Excel để chuyển đổi sang mã ASCII thì nó là "†". Khó hiểu ở chỗ là một số phần mềm quản trị dữ liệu hiển thị được ký tự này thành hình thánh giá trong khi một số phần mềm soạn thảo lại không làm được thế!

Khi nghiên cứu thêm chút nữa về UTF-8 thì em phát hiện ra rằng có một số mã có kết hợp với các ký tự mở rộng trong bảng mã ASCII. Hiện tại em vẫn Không rõ tại sao các trình quản lý CSDL lại chuyển nó thành dấu hiển thị được như vậy trong dữ liệu?

Vậy là đã rõ, bộ gõ Unikey không có lỗi, chỉ có vấn đề là tại sao cùng ký tự đó, các bộ soạn thảo đều không hiển thị được.
Đấy cũng là điều lý giải tại sao, bộ chuyển mã của Unikey bị lỗi. Tất cả các ký tự không hiển thị được như thế nó không đọc được và dẫn đến chuyển mã sai. Ví dụ của bạ Văn là một trường hợp điển hình. Tất cả các đoạn có tình huống như trên thì Unikey chỉ chuyển đổi 2 ký tự đầu của mã UTF-8 trong khi ký tự cuối có mã 134 nó lại bỏ qua.
Vụ này kính nhờ bác Switom nghiên cứu giúp để khai sáng cho bọn em.

siwtom · 1/10/13

paulsteigel đã viết:
Sau khi nghiên cứu code chuyển đổi của bác Long, thực tế em thấy là Unikey đúng là không sai gì cả, các giả định trước đây về vấn đề của Unikey liên quan đến Utf-8 đều không đúng nhưng em phát hiện ra một điểm lý thú:
Nếu dùng bộ gõ Unikey chuyển sang bảng mã UTF-8 Literal, một số ký tự sẽ không hiển thị được.
Ví dụ khi gõ chữ Ệ thì trên màn hình soạn thảo hiển thị là "á»". Trên thực tế, đoạn ký tự này gồm 3 ký tự với mã ASCII lần lượt là 225, 187 và 134.
Điều đặc biệt ở đây là: Ký tự số 134 không hiển thị ra nhưng khi dùng hàm Char trong Excel để chuyển đổi sang mã ASCII thì nó là "†". Khó hiểu ở chỗ là một số phần mềm quản trị dữ liệu hiển thị được ký tự này thành hình thánh giá trong khi một số phần mềm soạn thảo lại không làm được thế!

Khi nghiên cứu thêm chút nữa về UTF-8 thì em phát hiện ra rằng có một số mã có kết hợp với các ký tự mở rộng trong bảng mã ASCII. Hiện tại em vẫn Không rõ tại sao các trình quản lý CSDL lại chuyển nó thành dấu hiển thị được như vậy trong dữ liệu?

Vậy là đã rõ, bộ gõ Unikey không có lỗi, chỉ có vấn đề là tại sao cùng ký tự đó, các bộ soạn thảo đều không hiển thị được.
Đấy cũng là điều lý giải tại sao, bộ chuyển mã của Unikey bị lỗi. Tất cả các ký tự không hiển thị được như thế nó không đọc được và dẫn đến chuyển mã sai. Ví dụ của bạ Văn là một trường hợp điển hình. Tất cả các đoạn có tình huống như trên thì Unikey chỉ chuyển đổi 2 ký tự đầu của mã UTF-8 trong khi ký tự cuối có mã 134 nó lại bỏ qua.
Vụ này kính nhờ bác Switom nghiên cứu giúp để khai sáng cho bọn em.

Tôi không muốn nghiên cứu nữa vì nhức đầu lắm. Nếu convert luôn thất bại thì còn dễ dò tìm, đằng này lúc được lúc không.
Hôm qua tôi convert bằng Unikey nhưng thất bại. Hôm nay thử lại thì lại thành công. Bằng chứng là tôi có record màn hình. Như thế ít ra là 2 lần thành công: lần đầu tôi chỉ thử, thấy thành công nên làm lại lần 2 để record màn hình - cũng thành công nốt.

Chả nhẽ Unikey hoạt động tùy theo thời tiết? Tùy theo môi trường ở thời điểm cụ thể?. Chả nhẽ có con ma nào đó ngồi sau màn hình và chọc gậy bánh xe? Nguyên nhân thì chả biết được nhưng kiểu lúc được lúc không thì dùng phần mềm khác cho khỏe.

Tôi không dùng Unikey nhiều nên hơi bị bất ngờ ở cái vụ convert này. Nhìn code và đoán thì code không sai. Text copy vào clipboard thì lúc nào cũng như nhau. Thế mà lúc convert được lúc không. Chuyện không phải lạ mà là quá lạ.

À, tôi thử cho
TẤM NỆM NÀY QUÁ TỆ CẦN PHẢI THAY ĐỔI HỆ THỐNG SẢN XUẤT
Tấm nệm này quá tệ, cần phải thay đổi hệ thống sản xuất

thì thành công nhưng thử cho 2 dòng tiếp theo thì thất bại. Có thể do đó là UTF-8 "nhái", tức không chuẩn?

Trước khi có bài của bạn thì tôi có đọc bài của bạn Văn nói về lỗi khi chuyển đổi. Khi đó tôi có thử chuyển CSV thì chả thấy lỗi như bạn Văn nói. Lạ thật.

Tôi dùng Unikey 4.0 RC2

Tôi thử chạy video bằng Player của CamStudio thì thấy chất lượng tương đối được nhưng chạy bằng Media Player Classic và Windows Media Player thì chất lượng rất rất tồi. Vì thế tôi đính kèm Player. Thao tác: kích hoạt Player --> File --> Open --> chọn video --> File --> Play

http://www.mediafire.com/download/ys3rw248a9nx5c8/unikeyconvert1.rar

paulsteigel · 3/10/13

Sau một hồi nghiên cứu thì em cũng đã phát hiện ra lý do của vấn đề trong chuyển đổi mã Unicode sang Utf-8 và ngược lại của Unikey. Tất nhiên, điều này cũng gây ảnh hưởng đối với cả quá trình nhập liệu khi sử dụng bảng mã Utf-8.
Khi người dùng chọn chế độ nhập liệu ở dạng bảng mã Utf-8, cơ chế Hook bàn phím của Unikey xử lý trực tiếp mã nhập vào sau đó chuyển nhóm ký tự nhập vào sang bảng mã tương ứng được chọn trước đó. Khi quan sát cách thức xử lý với một số ký tự đặc biệt (như trong trường hợp em đã nêu trong các bài trước) như chữ Ệ, Ộ ...vv có các ký tự mở rộng trong bảng mã ASCII, Unikey thể hiện một số điểm như sau:

Chuỗi đầu vào cần nhập là "KỶ NIỆM, Ở CỬA HỘI "

(1) Nếu nhập trực tiếp sử dụng bảng mã Utf-8, kết quả là "Ká»¶ NIá»M á» Cá»¬A Há»I". Sau đó sử dụng lại chuỗi này và chuyển sang Unicode thì kết quả đúng như chuỗi ban đầu. Tuy nhiên, khi nhập trực tiếp trong Excel thì khoảng trắng mà ta nhìn thấy trước chữ M hoặc I sẽ không có mặc dù trên thực tế là có một ký tự ở đó (nếu dùng Word để nhập thì khoảng trắng đó sẽ hiện ra).

(2) Nếu nhập chuỗi Unicode dựng sẵn, sử dụng công cụ chuyển đổi từ Unicode sang UTF-8 của Unikey, dán từ Clipboard vào màn hình soạn thảo, chuỗi kết quả là: "Ká»¶ NIá»†M, á»ž Cá»¬A Há»˜I ".
Sau đó cũng sử dụng chính chuỗi này để chuyển ngược lại từ UTF-8 sang Unicode thì kết quả giống như cũ "KỶ NIỆM, Ở CỬA HỘI"

Điểm đáng ngạc nhiên ở đây là Ký tự "†" chỉ hiển thị khi nó được xử lý trong Clipboard còn khi thao tác trực tiếp trong màn hình soạn thảo thì nó không hiển thị ra.

Tiếp nữa, nếu lưu file theo trường hợp 1 thành dạng CSV (kiểu dữ liện đơn giản nhất). Kết quả là chuỗi vừa nhập được lưu thành "Ká»¶ Niá»†M á»ž Cá»¬A Há»˜I". Dùng Unikey chuyển sang Unicode (bằng cách chép dán) thì xong, kết quả bị lỗi "KỶ Ni†M ž CỬA H˜I". Khi kiểm nghiệm với chuyển mã không dùng Clipboard thì lỗi này không gặp phải.

Mặc dù chúng ta không sai trong thao tác, kết quả cuối cùng lại bị sai (tương tự như vậy, file của bạn Văn cũng không có vấn đề gì). Điều này làm nảy sinh nghi vấn về cơ chế đẩy dữ liệu ra của Unikey. Có vẻ như Unikey đã không làm một việc là chuyển ký tự số mở rộng 134 này từ Byte Stream sang kiểu chuỗi (Nếu em nói sai các bác cứ dạy, vì đây chỉ là một dạng suy đoán) nên màn hình soạn thảo sẽ không hiển thị ký tự nhưng khi lưu số liệu các phần mềm soạn thảo đã chuyển các ký tự này về dạng nguyên thủy của nó. Và bản thân Unikey, khi gặp trường hợp này, phần lấy số liệu cho công cụ chuyển mã của phần mềm có thể đã không kiểm soát được tình huống này.

Điều này cũng thấy rõ hơn, nếu nhập số liệu tương tự vào trình quản lý Dữ liệu của MYSQL hoặc SQL SERVER thì các ký tự không nhìn thấy đó lại được chuyển thành dạng chuỗi "†".
Như thế có thể tạm kết luận là, riêng với bộ mã Utf-8, Unikey bị thiếu sót trong việc xử lý dữ liệu, và điều này là việc chúng ta cần nắm được để tránh khi thao tác với số liệu có liên quan đến Utf-8, đặc biệt là trong khi xử lý số liệu liên quan đến Web vì chuẩn mã hóa thông dụng đối với Unicode hiện tại đều dùng Utf-8.

Trong những trường hợp như vậy (chuyển qua lại từ Unicode sang Utf-8), ta nên tránh dùng công cụ chuyển mã của Unikey theo dạng thức copy/chuyển mã/ dán để không bị hỏng số liệu vì cơ chế này có thể đang có lỗi như kể trên.

Em xin phép được chia sẻ vài điểm như vậy!

siwtom · 3/10/13

paulsteigel đã viết:
Sau một hồi nghiên cứu thì em cũng đã phát hiện ra lý do của vấn đề trong chuyển đổi mã Unicode sang Utf-8 và ngược lại của Unikey. Tất nhiên, điều này cũng gây ảnh hưởng đối với cả quá trình nhập liệu khi sử dụng bảng mã Utf-8.
Khi người dùng chọn chế độ nhập liệu ở dạng bảng mã Utf-8, cơ chế Hook bàn phím của Unikey xử lý trực tiếp mã nhập vào sau đó chuyển nhóm ký tự nhập vào sang bảng mã tương ứng được chọn trước đó. Khi quan sát cách thức xử lý với một số ký tự đặc biệt (như trong trường hợp em đã nêu trong các bài trước) như chữ Ệ, Ộ ...vv có các ký tự mở rộng trong bảng mã ASCII, Unikey thể hiện một số điểm như sau:

Chuỗi đầu vào cần nhập là "KỶ NIỆM, Ở CỬA HỘI "

(1) Nếu nhập trực tiếp sử dụng bảng mã Utf-8, kết quả là "Ká»¶ NIá»M á» Cá»¬A Há»I". Sau đó sử dụng lại chuỗi này và chuyển sang Unicode thì kết quả đúng như chuỗi ban đầu. Tuy nhiên, khi nhập trực tiếp trong Excel thì khoảng trắng mà ta nhìn thấy trước chữ M hoặc I sẽ không có mặc dù trên thực tế là có một ký tự ở đó (nếu dùng Word để nhập thì khoảng trắng đó sẽ hiện ra).

(2) Nếu nhập chuỗi Unicode dựng sẵn, sử dụng công cụ chuyển đổi từ Unicode sang UTF-8 của Unikey, dán từ Clipboard vào màn hình soạn thảo, chuỗi kết quả là: "Ká»¶ NIá»†M, á»ž Cá»¬A Há»˜I ".
Sau đó cũng sử dụng chính chuỗi này để chuyển ngược lại từ UTF-8 sang Unicode thì kết quả giống như cũ "KỶ NIỆM, Ở CỬA HỘI"

Điểm đáng ngạc nhiên ở đây là Ký tự "†" chỉ hiển thị khi nó được xử lý trong Clipboard còn khi thao tác trực tiếp trong màn hình soạn thảo thì nó không hiển thị ra.

Tiếp nữa, nếu lưu file theo trường hợp 1 thành dạng CSV (kiểu dữ liện đơn giản nhất). Kết quả là chuỗi vừa nhập được lưu thành "Ká»¶ Niá»†M á»ž Cá»¬A Há»˜I". Dùng Unikey chuyển sang Unicode (bằng cách chép dán) thì xong, kết quả bị lỗi "KỶ Ni†M ž CỬA H˜I". Khi kiểm nghiệm với chuyển mã không dùng Clipboard thì lỗi này không gặp phải.

Mặc dù chúng ta không sai trong thao tác, kết quả cuối cùng lại bị sai (tương tự như vậy, file của bạn Văn cũng không có vấn đề gì). Điều này làm nảy sinh nghi vấn về cơ chế đẩy dữ liệu ra của Unikey. Có vẻ như Unikey đã không làm một việc là chuyển ký tự số mở rộng 134 này từ Byte Stream sang kiểu chuỗi (Nếu em nói sai các bác cứ dạy, vì đây chỉ là một dạng suy đoán) nên màn hình soạn thảo sẽ không hiển thị ký tự nhưng khi lưu số liệu các phần mềm soạn thảo đã chuyển các ký tự này về dạng nguyên thủy của nó. Và bản thân Unikey, khi gặp trường hợp này, phần lấy số liệu cho công cụ chuyển mã của phần mềm có thể đã không kiểm soát được tình huống này.

Điều này cũng thấy rõ hơn, nếu nhập số liệu tương tự vào trình quản lý Dữ liệu của MYSQL hoặc SQL SERVER thì các ký tự không nhìn thấy đó lại được chuyển thành dạng chuỗi "†".
Như thế có thể tạm kết luận là, riêng với bộ mã Utf-8, Unikey bị thiếu sót trong việc xử lý dữ liệu, và điều này là việc chúng ta cần nắm được để tránh khi thao tác với số liệu có liên quan đến Utf-8, đặc biệt là trong khi xử lý số liệu liên quan đến Web vì chuẩn mã hóa thông dụng đối với Unicode hiện tại đều dùng Utf-8.

Trong những trường hợp như vậy (chuyển qua lại từ Unicode sang Utf-8), ta nên tránh dùng công cụ chuyển mã của Unikey theo dạng thức copy/chuyển mã/ dán để không bị hỏng số liệu vì cơ chế này có thể đang có lỗi như kể trên.

Em xin phép được chia sẻ vài điểm như vậy!

Cám ơn bạn đã chia sẻ.

Đúng là việc chuyển qua lại utf8 <-> unicode thông qua Clipboard nó bấp bênh thế nào ấy. Tôi không sử dụng Unikey nhưng có cảm giác là tốt hơn là dùng chuyển tập tin. Mà tốt nhất là dùng phần mềm, code khác.
Tôi rất thích "nghiên cứu" nhưng rất tiếc là không biết C++. Chỉ xem code và dựa trên những hàm API và ngữ cảnh để đoán là code làm gì. Có một lần trong quá khứ tôi chỉ nghiên cứu xem Unikey xử lý các phím nhấn như ra sao. Vì hook thì ai cũng biết nhưng xem để biết nó "đánh tráo" các ký tự như thế nào. Tuy nhiên nếu không lập trình C++ mà đọc code thì mệt ơi là mệt.

Làm thế nào để đổi Font chữ trong file sau (1 người xem)

Người dùng đang xem chủ đề này

Thành viên gạo cội

File đính kèm

Huyền thoại GPE

Thành viên gạo cội

Huyền thoại GPE

Thành viên hoạt động

Thành viên gạo cội

Huyền thoại GPE

Thành viên gạo cội

Huyền thoại GPE

File đính kèm

Thành viên gạo cội

Huyền thoại GPE

Thành viên mới

Thành viên mới

Nhi bất hoặc!

Thành viên gạo cội

Thành viên gắn bó

Nhi bất hoặc!

Thành viên gắn bó

Nhi bất hoặc!

Thành viên gắn bó

Nhi bất hoặc!

Thành viên gắn bó

Thời gian đếm ngược.