chia sẻ kinh nghiệm

Dùng Google OCR hoán chuyển sang tiếng VIệt (cập nhật)

Trước đây tôi có post một bài viết về cách hoán chuyển sang tiếng Việt bằng OCR Google. Nay nhận thấy cách thức cũ không còn hiệu lực vì Google đã thay đổi quá nhiều, nên viết lại, hầu giúp các bạn muốn hoán đổi các trang chữ chụp (scanned) sang WORD.

Tôi đã thử nhiều nhu liệu hoán chuyển, miễn phí có, tiền có, nhưng OCR  Google là một OCR tôi ưng ý nhất. Hơn nữa, nó lại miễn phí. Trong khi một nhu liệu OCR  được sản xuất trong nước giá cả triệu đồng VN !

Ưng ý vì nó ít lỗi. Chỉ cần một tiếng đồng hồ tôi có thể hoán chuyển, đổi sang WORD một truyện ngắn tuyệt vời của Lê văn Thiện, chụp lại từ tạp chí Trình Bày. Đó là đổi từ những trang chữ in cách d89ây 40, 50 năm. Nếu mà trang chụp in 10 năm trở lại, thì sự chính xác lên tới 90%-95%.

Ví dụ trang chụp trên Trình Bày xuân Nhâm Tý năm 1972:

THT-36-37-1

 

OCR GOOGLE hoán chuyển sang tiếng Việt như sau:

 

Ngày thanh xuân

TRẦN HOÀI THƯ

Những mảnh lựu đạn chày ghìm sâu vào hai bắp , một tai bị sức nổ dồn nén của lựu đạn nội hóa làm bứt luôn màn chỉ, đó là niềm hy vọng cuối càng của Hạo trong những ngày chờ đợi ra hội dồng giám định y khoa. Lại thêm một đôi mắt cận thị nặng độ của anh nữa. Anh đã quả quyết với già đình và bè bạn là anh sẽ được giải ngũ từ giã bộ đồ trận, để trở về cuộc sống dân sự. Anh đã có những giờ phút ngất ngây khỉ nằm trên giường điều trị, để trí óc mơ về một ngày nào đó, anh sẽ được thong dong trong bộ quần áo nhẹ tênh, bỏ qua những lệnh lạc bom đạn, những cơn kinh hoàng trong thờỉ bỉnh lửa, những lo âu phiền lụy của những ngày thanh xuân, Anh như người mộng du, đốt thời gian buồn bã và cô đơn trong trại bệnh bằng những nỗi hồi hộp không đâu. Chao , môt ngày nào đó, ta cầm được cái giấy đầy ân sủng , chắc ta phải điên lên vì sung sướng, chắc ta phải về khóc dưới gối cha già, kể lể : Bây giờ con đã thực sự bình yên. Ba sẽ thôi hằng đêm thắp nhang khấn

aguyện trước bàn thờ. Ba sẽ không còn thức trắng lo lắng cho số phận của con. Ba sẽ không cỏn đốt những điếu thuốc để nghĩ ngợi về con. Con đã thực sự trở về rồi ba ơi. Anh bắt đầu phác họa một cuộc sống mới. Anh sẽ để dành một thời gian vài tháng, về một thành phố biển để nghỉ ngơi dưỡng sức. Anh sẽ đi một vòng xe khắp thành thị miền

Nam để thăm bè bạn xa cách cùng

chiêm ngưỡng non nước thân yêu. Rồi anh sẽ cố gắng tiếp tục con đường học vấn đã bỏ dở, có thể anh

, sẽ thỉ vào sư phạm để chọn một

nghề bảo đảm và nhàn hạ. Không, anhcũng chẳng cần chọn cái nghề mà từ trước anh không ưa thích. Cái nghề khiến đời sống dễ bị sa lầy, anh nghĩ thế. Anh không chịu cái cảnh một ông đồ non đạo mạo chôn vùi ngày tháng cùng viên phấn và những bài học luân lý. Chính vì ý tưởng ấy, anh đã ân hận về sau này. Và khỉ biết thì sự đã lỡ rồi,

Bạn bè anh đã được biệt phái về | g

nhiệm sở cũ, đang an nhàn trong thời buổi tàn khốc nhất của cuộc chiến. Nhưng bây giờ, sau khi từ

 

Sau đây là từng bước một :

 

1) chọn Google Drive. Đây là một application của Google.  Bạn có thể dùng đường link dưới đây để biết rõ thêm về việc thiết lập Google Drive

https://drive.google.com/drive/

2) Trang Google Drive hiện ra. Chú ý cái symbol  được đánh dấu bằng mũi tên. Đó là Setting.

OCR-1

 

 

3) Sau khi bạn click SETTING, môt screen mới hiện ra. Bạn check vào cái ô Convert uploaded files…. . Việc này buộc computer hoán chuyển cái file bạn muốn đổi. Computer không thần thành gì hết. Nó vô tri. Phải có bàn tay người nhúng vào. Đây là việc làm của programmer.  Program bắt nguười xữ dụng phải nghe theo, phục tùng mệnh lệnh.

OCR-2

 

Sau khi bạn setting yêu cầu máy phải hoán chuyển, giờ bạn có thể upload trang scanned mà bạn muốn chuyển sang tiếng Việt. Trên trang Drive, bạn click vào “NEW”:

OCR-3

 

 

 

 

 

ocr-4ocr-5ocr-6ocr-7