File dokumen dapat dibaca dengan Java. Walaupun Java tidak menyediakan fitur ini secara langsung, tetapi kita dapat menggunakan library Apache POI untuk membaca (read only) file *.doc. Baiklah, karena kita menggunakan library ekternal jadi kita harus mendownload file library nya dulu di web resminya : http://poi.apache.org/download.html.
Setelah di download, ekstrak dan masukkan semua libray (jar) ke dalam project yang mau di buat..inti dari pembacaan dokumen (.doc) adalah pada bagian source dibawah ini:
... try{ fis = new FileInputStream(file); doc = new HWPFDocument(fis); we = new WordExtractor(doc); //get Paragraph text as array paragraphs = we.getParagraphText(); for(int i = 0; i < paragraphs.length; i++){ textHasil.append(paragraphs[i]); } }catch(Exception exc){ System.out.println(exc.getMessage()); } ...
Berikut adalah hasil programnya: