當你閱讀一份 PDF 文件,看到裡面有一份統計表格很有參考價值,總是會想說;「嗯 … 不知道可不可以把這個表格複製下來,再來修正一下、做一份統計參考報告呢?」
看到 PDF 內的表格,總是會有想要複製或是編輯表格的需求,許多人每天「望表興嘆」,好像除了印出來或是重新製作、抄寫表格就沒有其他更有效率的方式。若是遇到大量的表格需要重製,真的是會非常浪費我們的時間。
其實只要是 PDF 文件內的表格,都可以使用 Acrobat 9 來幫助我們完成編輯或是複製表格達到再利用的需求。
Note:要取出 PDF 文件的表格等內容,前提是這個 PDF 文件是沒有加密的狀態,若是 PDF 文件已被加密,則需要與 PDF 文件製作的人聯絡以取得原始或是未加密的檔案。
Note :免費的 Adobe Reader 只可以讓我們閱讀或是列印 PDF 檔案,若是有上述轉換表格等需求,請使用 Adobe Acrobat 9 軟體來操作。
若我們看到的 PDF 檔案,表格是以文字的狀態呈現,也就是可以用「選擇工具」來確認一下是不是可以選到 PDF 內表格的文字:
我們也可以檢查一下這個 PDF 是經由哪個軟體轉換的,要看這個檔案的所有資訊,可以在「檔案 > 內容」的文件內容面板看到:
「文件內容」顯示這個 PDF 檔案是從 Excel 內按下 PDFMaker 轉換的。 |
只要這個 PDF 檔案是從 Office 系列轉換過來的,那麼使用 Acrobat 9 就可以把文件內的表格做最有效率的運用。若發現是其他不知名的軟體轉換的,則需要注意其相容性,尤其是文字部分。
因為有些軟體轉換出的 PDF ,雖然也叫 PDF ,但是因為其轉換的方式與方法不合乎 ISO 標準,所以有時候文字部分雖然看起來像是文字,但是並沒有具備足夠的資訊供我們再利用,這就常常造成要再利用、或是編輯 PDF 文件上的困擾。
另外,若是發現這個檔案是從一些繪圖軟體轉換過來的( Ex. Photoshop 等),那麼有可能 PDF 某些部分會是圖片,這樣我們就需要先經過文字辨識的程序,才能再利用檔案內表格的資訊。
狀況一: PDF 內表格是文字
1、確認表格是文字後,可以使用前述的選擇工具,把想要選擇的表格文字上拖拉選取文字,按下滑鼠右鍵,選擇「複製為表」:
2、這樣複製想要的表格文字後,再開啟 Excel ,新增檔案、貼上內容即可:
右鍵選項還有另外兩個選擇:
●儲存為表:會把選到的文字儲存成.csv檔,可以用Excel開啟。
●在試算表中開啟表:會直接切換到Excel軟體開啟選到的表格。
這兩種方式可以得到幾乎一樣的結果:
狀況二: PDF 內表格是圖片
若是使用選擇工具想要選擇文字時,發現拖拉出來是一個方塊狀,沒辦法選到文字,如下圖一樣:
這表示圈選到的部分是一個圖片,這時候就沒辦法直接按下右鍵把資料轉換到 Excel ,不過可以運用 Acrobat 9 的另一個很棒的功能:「 OCR 文字識別」。
使用 OCR 把表格資料取出
1、按下右鍵可以在跳出的選單內選擇:「使用 OCR 識別文字」:
也可以使用:「文件 > OCR 文字識別 > 使用 OCR 識別文字」
2、確認「設定」內「主要 OCR 語言」選項是「中文(繁體)」:
若發現語言不是中文,可以按下「編輯」選擇正確的主要 OCR 語言 |
3、辨識完後就可以使用按下滑鼠右鍵的上述使用方式,把表格資料在 Excel 內開啟:
使用另存檔案功能
使用 Acrobat 9 還可以把含有表格資料的 PDF 檔案使用「另存新檔」的方式把文件存成 Excel 格式的 XML 檔案。 選擇:「檔案 > 另存新檔」,在「存檔類型」選擇「 Excel 試算表中的表( *.xml )」:
這個附檔名雖然是 xml ,但是是 Excel 規格的 xml 檔,所以可以使用 Excel 直接開啟,效果也非常好:
同樣的,若是表格是圖片,也可以先進行 OCR 文字識別後再用「另存新檔」的方式存成這個格式。
Note :多頁的 PDF 轉換成 Excel 的 XML 時,原本在 Excel 的連續資料會變成一個「工作表」。 大量批次轉換
Acrobat 9 有一個很好用的功能:「轉存多個檔案」,若是有很多個 PDf 檔案都是有表格資訊在裡面,可以一次請 Acrobat 幫我們處理,選擇:「檔案 > 轉存 > 轉存多個檔案」:
在「轉存多個檔案」選擇要轉換的檔案後按下「確定」,可以設定要轉換的格式:
在「輸出格式」選擇「 Excel 試算表中的表」,按下「確定」後, Acrobat 就會自動幫我們處理檔案的轉換,這個方式在處理大量檔案時最為方便。
没有评论:
发表评论