如何將PDF格式轉(zhuǎn)換為WORD文檔
經(jīng)常在PDF形式上看到有好的文件時(shí),想把它拿出來,但是卻是不行,所以我第一步就是找一下有沒有可以到PDF格式與WORD文檔的轉(zhuǎn)換,在網(wǎng)上找了一下,原來還真的有很多,今天我就把這些方法也傳上來,不過我也發(fā)現(xiàn)一個(gè)問題,就是如果PDF本身是圖片的話,那也沒辦法轉(zhuǎn)換,不知道還有沒有其它方法可以把PDF圖片格式也轉(zhuǎn)換過來那就最好了,不過還是希望Adobe Acrobat 公司在開發(fā)上能夠和OFFICE 相結(jié)合,那對(duì)我們來說使用就更方便了.
1、實(shí)現(xiàn)工具:Office 2003中自帶的Microsoft Office Document Imaging
應(yīng)用情景:目前國(guó)外很多軟件的支持信息都使用PDF方式進(jìn)行發(fā)布,如果沒有Adobe Reader,無法查看其內(nèi)容,如果沒有相關(guān)的編輯軟件又無法編輯PDF文件。轉(zhuǎn)換為DOC格式則可以實(shí)現(xiàn)編輯功能。盡管有些軟件也可以完成PDF轉(zhuǎn)換為DOC的工作,但很多都不支持中文,我們利用Office 2003中的Microsoft Office Document Imaging組件來實(shí)現(xiàn)這一要求最為方便。
使用方法:
第一步:首先使用Adobe Reader打開待轉(zhuǎn)換的PDF文件,接下來選擇“文件→打印”菜單,在打開的“打印”設(shè)置窗口中將“打印機(jī)”欄中的“名稱”設(shè)置為“Microsoft Office Document Image Writer”,確認(rèn)后將該P(yáng)DF文件輸出為MDI格式的虛擬打印文件。
編輯提示:如果你在“名稱”設(shè)置的下拉列表中沒有找到“Microsoft Office Document Image Writer”項(xiàng),那證明你在安裝Office 2003的時(shí)候沒有安裝該組件,請(qǐng)使用Office 2003安裝光盤中的“添加/刪除組件”更新安裝該組件。
第二步:運(yùn)行Microsoft Office Document Imaging,并利用它來打開剛才保存的MDI文件,選擇“工具→將文本發(fā)送到Word”菜單,并在彈出的窗口中勾選“在輸出時(shí)保持圖片版式不變”,確認(rèn)后系統(tǒng)提示“必須在執(zhí)行此操作前重新運(yùn)行OCR。這可能需要一些時(shí)間”,不管它,確認(rèn)即可。
編輯提示:目前,包括此工具在內(nèi)的所有軟件對(duì)PDF轉(zhuǎn)DOC的識(shí)別率都不是特別完美,而且轉(zhuǎn)換后會(huì)丟失原來的排版格式,所以大家在轉(zhuǎn)換后還需要手工對(duì)其進(jìn)行后期排版和校對(duì)工作。
2、實(shí)現(xiàn)工具:Solid Converter PDF
應(yīng)用情景:利用Office 2003中的Microsoft Office Document Imaging組件來實(shí)現(xiàn)PDF轉(zhuǎn)Word文檔在一定程度上的確可以實(shí)現(xiàn)PDF文檔到Word文檔的轉(zhuǎn)換,但是對(duì)于很多“不規(guī)則”的PDF文檔來說,利用上面的方法轉(zhuǎn)換出來的Word文檔中常常是亂碼一片。為了恢復(fù)PDF的原貌,推薦的這種軟件可以很好地實(shí)現(xiàn)版式的完全保留,無需調(diào)整,而且可以調(diào)整成需要的樣板形式。
使用方法:
1、下載安裝文件Solid Converter PDF,點(diǎn)擊安裝。
編輯提示:安裝前有個(gè)下載安裝插件的過程,因此需要保證網(wǎng)絡(luò)連接通暢。
2、運(yùn)行軟件,按工具欄要求選擇需要轉(zhuǎn)換的PDF文檔,點(diǎn)擊右下的“轉(zhuǎn)換”(Convert)按扭,選擇自己需要的版式,根據(jù)提示完成轉(zhuǎn)換。
一,PDF轉(zhuǎn)換WORD篇
如何提取PDF中的文字,圖片等特效
我們?nèi)粘9ぷ鲗W(xué)習(xí)中有關(guān)的學(xué)術(shù)論文或?qū)W術(shù)報(bào)告或者課程教材等等都以pdf格式保存,如何把它們轉(zhuǎn)換成可編輯的word文檔或者提取相應(yīng)的重要信息。網(wǎng)上有不少 pdf 到 word 的轉(zhuǎn)換軟件或插件,可是大都對(duì)英文等識(shí)別姣好,一些繁體的軟件又不適合我們,我們可以利用office2003的組件microsoft office Document Imaging可以實(shí)現(xiàn)從PDF中任意提取任何頁(yè)面的文字和圖像等功能。
先來介紹一下最簡(jiǎn)單的提取方法吧,打開PDF的文件資料,利用本身的文本提取工具可以完全提取了,但是有的PDF是增加了128位秘鑰的,想要提取是不會(huì)那么簡(jiǎn)單的,即使用軟件或者簡(jiǎn)單復(fù)制的時(shí)候,出來的效果卻是亂碼之類的東西。
而且單純的用文本工具只能把PDF中的文字提取出來,其他的特效:圖片等是無法顯示出來的,首先看一例文本提取:
我想提取下圖的文字:具有SAP的企業(yè)系統(tǒng)。
直接在ADOBE READER 的“工具”選項(xiàng)那就輕松可以實(shí)現(xiàn):
或者直接利用快捷方式中的圖形直接提取就可以了:
直接提取的效果就是我們通常所說的“復(fù)制”到“粘貼”,文字東西少還是可以,如果有300頁(yè)的PDF我怕只有“傻瓜”才會(huì)那么做吧!呵呵!玩笑!下面的圖片我們?cè)趺崔k(舉個(gè)例子)如果是報(bào)表的數(shù)據(jù)圖呢?如何人、放到WORD里呢?
所以只有求助office2003的組件microsoft office Document Imaging的功能了,即使它不是最好的,在ADOBE READER 那有一個(gè)“打印機(jī)”的圖標(biāo),進(jìn)入后來到如下的畫面,在名稱那選擇“microsoft office Document Imaging”,下面還有設(shè)置的打印范圍,可以選擇所有的PDF文件或者選擇想要提取的頁(yè)面也可以,或者指定多少頁(yè)到多少頁(yè)都是可以實(shí)現(xiàn)的,頁(yè)面處理功能就是保持頁(yè)面的大小或者根據(jù)你要打印的紙張的大小選擇就可以了,頁(yè)數(shù)就是處理后的頁(yè)數(shù)。
根據(jù)需要我最后進(jìn)行了選擇,什么都保持原來的大小和清晰度等,然后我們確認(rèn)就可以了:
之后會(huì)出現(xiàn)“保存”的對(duì)話框,注意下面的文件名,可以更改或者改變的,但是下面的保存類型千萬不要變,保持MDI格式就可以了:
之后會(huì)出現(xiàn)所預(yù)覽的頁(yè)面,也就是你上面選擇參數(shù)后的結(jié)果,這時(shí)候的圖片和PDF還是一樣的:
之后在[color[red]“工具”這個(gè)選項(xiàng)上選擇“將文本發(fā)送到WROD”這個(gè)選項(xiàng):
然后出現(xiàn)一個(gè)可選擇的對(duì)話框,選擇的時(shí)候要注意選擇“輸出時(shí)候保持文件不變”,然后保存到想要的位置:
如果機(jī)器之前設(shè)置了OCR擦件選項(xiàng),需要更新的,不過不要緊的,系統(tǒng)會(huì)自動(dòng)給你安裝的,選擇確定就可以,時(shí)間也不會(huì)很久的,我的機(jī)器3秒OK了:
然后安裝開始:
之后就是安裝的進(jìn)度條了,很快安裝OVER,功能可以用了:
最后呈現(xiàn)在你面前的就是轉(zhuǎn)換后的文字了,其實(shí)應(yīng)該是黑色字體,5號(hào)字的大小的,我從新給調(diào)整了和以前的模式,是不是一樣的呢?
圖片的實(shí)現(xiàn)和文字的實(shí)現(xiàn)是一樣的,不過WORD一定要支持圖片模版的,2003版本的可以,2000沒嘗試,經(jīng)過很多的使用,可以說95%的文字都是可以清晰的提取出來的,這點(diǎn)沒問題的!呵呵!
二,WORD轉(zhuǎn)換PDF篇
利用5D PDF CREATER 轉(zhuǎn)換PDF
WORD轉(zhuǎn)換到PDF可以實(shí)現(xiàn)的軟件簡(jiǎn)直太多了,但是本人在學(xué)習(xí)應(yīng)用的時(shí)候覺得還是5D-PDF最好不過了,畢竟支持微軟的產(chǎn)品實(shí)在是太少了,相對(duì)這款軟件才真正實(shí)現(xiàn)了WORD PPT EXCEL FRONTPAGE等眾多OFFICE軟件的轉(zhuǎn)換,而且效果和速度都是一流的。
首先還是用WORD或者PPT等打開我們需要轉(zhuǎn)換的文件,這里以WORD為例子,就是我編寫的這個(gè)帖子吧:
然后在“文件”選項(xiàng)那選擇“打印”的選項(xiàng):
之后來到打印的屬性窗口中,在這里可以有很多屬性可以供我們選擇,可謂是功能強(qiáng)大啊,在名稱中選擇“5D PDF CREATER”,打印內(nèi)容中可以選擇本版面的文字和所有版面的文字等,而且還可以設(shè)置頁(yè)數(shù)和大小,想變成什么樣的PDF都可以,而且在打印機(jī)屬性中還可以設(shè)置變成PDF后的顏色,使它更加個(gè)性化:
另外在“打印”屬性中可以有如下選擇,調(diào)節(jié)A4的紙張大小和形狀,打印成PDF的文字。XML信息等等,而且選擇隱藏和背景色,最后確定:
最后會(huì)彈出對(duì)話框,我們可以更改文件名,保存的類型也很多,大家可以自己嘗試的,我們?cè)谶@變換的是PDF形式,下面的就是5D PDF CREATER最強(qiáng)大的地方了,我們選的是“PRESS READY”這里可以自己研究著,里面有好多想不到的東西呢!呵呵!最后確定:
最后我們看看轉(zhuǎn)換的效果吧,由于我沒有加任何的特效所以很一樣的,大家可以根據(jù)自己的愛好著名自己的信息等等,防止別人更改等,很多人性的東西:
3.ScanSoft PDF Converter For Microsoft Word
我們平時(shí)下載的資料中,有許多都是以PDF格式發(fā)布的,但有時(shí)需要將PDF文檔中的信息轉(zhuǎn)換到Word中進(jìn)行編輯,使用復(fù)制粘貼的方法雖然可以將文字、圖片等信息轉(zhuǎn)移到Word中,但是原PDF文檔中的格式、字體等信息就會(huì)丟失,編輯起來很不方便,我們可以使用ScanSoft公司發(fā)布的“PDF Converter”插件來完成從PDF文檔向Word文檔的轉(zhuǎn)換工作。
下載并安裝“PDF Converter”后,將Word文檔的“打開”對(duì)話框的“文件類型”改為“所有文件”,使用Word加載PDF文檔,插件會(huì)自動(dòng)啟動(dòng)并進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換后的格式、圖片位置等信息基本上可以保持原有PDF文檔的風(fēng)格。
說明:
文中介紹的插件和模板都是基于Word2003的。大部分第三方插件都是基于Word中的宏來嵌入和運(yùn)行。Word2003出于對(duì)文檔安全性的考慮,將宏的安全性默認(rèn)為“高”,使得一些第三方插件無法運(yùn)行。您在使用本文介紹的插件時(shí),可以將Word2003中的“宏安全性”設(shè)置為“中”。
具體設(shè)置方法為:打開一個(gè)Word文檔,將||下的“安全級(jí)”設(shè)置為“中”。在運(yùn)行下面介紹的插件時(shí),Word會(huì)彈出“安全警告”對(duì)話框,如果確認(rèn)是自己所安裝的插件,就可以單擊“啟用宏”來運(yùn)行此插件。
4.舉辦國(guó)際會(huì)議,有時(shí)候會(huì)遇到外國(guó)參加者無法閱讀我們制作的pdf文件
那是因?yàn)槲覀冇弥形南到y(tǒng),轉(zhuǎn)化之后,對(duì)方無法辨識(shí)中文字符集。
這時(shí)候可以用嵌入字體和調(diào)整顏色設(shè)置來解決,當(dāng)然,相應(yīng)的,文件也會(huì)變得比較大。
具體操作如下:
1,安裝acrobat 完整版(不是Acrobat Reader,是Acrobat)。
2,打開word(ppt)文檔 。
3,單擊菜單中“文件”,選擇“打印” 。
4,在打印機(jī)中選擇 Acrobat Distiller,單擊右側(cè)的“屬性” 。
5,點(diǎn)到“Adobe PDF 設(shè)置”,選擇“編輯轉(zhuǎn)換設(shè)置” 。
6,點(diǎn)到“字體”,把“嵌入所有字體”打上勾(這一步很關(guān)鍵啊!)。
7,點(diǎn)到“顏色”,把”設(shè)置文件“從“無”改為“歐洲印前默認(rèn)設(shè)置”(關(guān)鍵!關(guān)鍵!) 。
8,點(diǎn)擊右側(cè)的“確定”或者“另存為”,都會(huì)跳出對(duì)話框,讓你保存當(dāng)前設(shè)置。(選個(gè)好記的名字吧,比如gUT)
9,存好后,再次點(diǎn)擊“確定”退回到“Adobe PDF 設(shè)置”,這時(shí)候的轉(zhuǎn)換設(shè)置已經(jīng)變成新設(shè)置了,如“gUT”。
10,點(diǎn)擊“確定”,再點(diǎn)擊“確定”打印,就產(chǎn)出一個(gè)能夠在非中文系統(tǒng)中辨認(rèn)的pdf文件了。
11,記得下次重新開啟office并進(jìn)行Distiller打印的時(shí)候,要重新選擇一下轉(zhuǎn)換設(shè)置,在設(shè)置中選中“gUT”就可以了
5.將帶有鏈接的DOC文件轉(zhuǎn)成PDF
如果將100多個(gè)帶有大量鏈接的DOC文件轉(zhuǎn)換PDF文件,應(yīng)該怎么做?
利用Adobe Acrobat6.0的“從網(wǎng)頁(yè)創(chuàng)建PDF”(快捷鍵為“Shift+Ctrl+O”)轉(zhuǎn)換功能就可以輕松實(shí)現(xiàn)上述要求。
1.將需要轉(zhuǎn)換的DOC文件放置于同一個(gè)文件夾中,打開Word2003,依次打開“文件→新建→新建文檔→模板→本機(jī)上的模板→其他文檔→轉(zhuǎn)換向?qū)А保瑔⒂谩稗D(zhuǎn)換向?qū)А薄?br /> 2.單擊“下一步”按鈕選擇轉(zhuǎn)換方式,這里選擇將DOC文件轉(zhuǎn)換為HTML文件,繼續(xù)選擇“源文件夾”和“目標(biāo)文件夾”,最后確定需要轉(zhuǎn)換的文件,點(diǎn)擊“完成”。至此,就完成了文件格式的轉(zhuǎn)換。
接下來你應(yīng)該知道怎么做了吧。只有打開Acrobat將一個(gè)個(gè)HTML文件轉(zhuǎn)換為PDF文件,就可以輕松完成這個(gè)看似繁重的任務(wù)。
6.免費(fèi)的PDF打印機(jī),我試過用它把doc文件轉(zhuǎn)成pdf文件,非常好用!!
介紹:
下載地址:
Free Download (1.6MB) (Vista Ready)
開發(fā)者:
需要PS2PDF converter 的支持,可以從 這里下載免費(fèi)的 GPL Ghostscript 8.15 。
7.如何用acrobat 8.0 8.1將PDF轉(zhuǎn)換導(dǎo)出為DOC?中文版兼容于vista。以前我們想將PDF轉(zhuǎn)換為word(*.doc),通常用以下兩種方法:
ScanSoft PDF Converter for Microsoft Word 它是由ScanSoft公司和微軟共同組隊(duì)開發(fā)的一個(gè)Word的插件,它可以讓你在沒有Adobe Acrobat軟件的情況下,將PDF文檔轉(zhuǎn)化為Word文檔。它首先捕獲PDF文檔中的信息,分離文字、圖片、表格和卷,再將其統(tǒng)一到Word格式,并且基本上完全保留原來的格式和版面設(shè)計(jì)。所以它的轉(zhuǎn)化效果是比較理想的了,但是軟件比較大(我當(dāng)初用的版本有200MB左右,現(xiàn)在似乎小了不少,但是我沒有再用過它),而且轉(zhuǎn)化速度比較慢。
該軟件安裝完成后,會(huì)自動(dòng)嵌入到word中。如果沒有嵌入,可以在word工具欄的空白處單擊鼠標(biāo)右鍵,將它打勾選擇。它可以作為單獨(dú)的軟件啟動(dòng),也可以在word界面中啟動(dòng)。它的轉(zhuǎn)化方法如下:
1. 在Word界面,直接通過“文件”?>“打開”來打開需要轉(zhuǎn)化的PDF文件。
2. 此時(shí)插件會(huì)自動(dòng)彈出,在分析完P(guān)DF文件后即可自動(dòng)轉(zhuǎn)換成DOC格式的文檔。
總結(jié):在以前的使用過程當(dāng)中,我發(fā)現(xiàn)它的轉(zhuǎn)化效果很理想。比如,把一篇doc文檔轉(zhuǎn)換為pdf之后,用它轉(zhuǎn)換為doc;然后又把它轉(zhuǎn)換為pdf,再轉(zhuǎn)換為doc;如此反復(fù)多次之后,doc文檔的資料丟失率很低,版面保持得不錯(cuò),不是很亂。所以,它是比較理想的轉(zhuǎn)換工具。
PDF 2 Word PDF 2 Word是一個(gè)獨(dú)立運(yùn)行的小軟件,而非插件。它的版本很多,有的版本不需要安裝,直接運(yùn)行exe程序后,在軟件界面中選擇pdf、設(shè)置doc輸出路徑即可。
總結(jié):它在載入比較大的pdf文件時(shí)會(huì)稍慢一些,轉(zhuǎn)換速度非常快,對(duì)于圖片和文檔格式的識(shí)別不是很好。轉(zhuǎn)化后,文字基本保持格式,且都是在文本框當(dāng)中;圖片則會(huì)有些錯(cuò)位,不好進(jìn)行設(shè)置,且容易和帶文字的文本框重疊。但是,它基本很少丟失東西,對(duì)于這樣小巧玲瓏的軟件,這就不錯(cuò)了。
以前即便用acrobat professional 7.0來轉(zhuǎn)換pdf,出來的結(jié)果也是慘不忍睹, 現(xiàn)在好了,Adobe Acrobat 8.0 8.1 Professional 簡(jiǎn)體中文版 進(jìn)行轉(zhuǎn)換真是又快又好。方法也很簡(jiǎn)單,直接在文件菜單上選擇 另存為 save as,就可以在保存的文件類型中選擇 word格式了。
在測(cè)試的PDF中包括 圖片,表格,還有文字但是沒有公式。轉(zhuǎn)換以后版式保持很完整,沒有變形。今天嘗試轉(zhuǎn)換了一個(gè)544頁(yè)帶圖片,文字的PDF文件花費(fèi)20