Ajuda - Busca - Membros - Calendário
Versão Completa: Lendo arquivos .pdf e .doc no Linux‏
Fórum Script Brasil > Programação & Desenvolvimento > PHP
Renato Penna

Bom dia povo! Estou tentando ler arquivos .doc e .pdf no Linux, mas não consigo. Estou tentando usar o comando $conteudo = shell_exec("catdoc $arq"); mas retorna vazio (como se o arquivo não tivesse nada escrito). Quando eu uso a forma padrão ($fp = fopen($arq,"r"); $conteudo = fread($fp,filesize($arq))wink.gif ele retorna um monte de lixo:

&(%[+bjbj.+Y[[[[[[$Z%%%Y%Y%%%J%E%%% %%:Teste para leitura de arquivo word com php*+hAhx+,1h. A!#$%f666666666vvvvvvvvv6666666666666666666666666666666666666666666666666666666hH6666
666666666666666666666666666666666666666666666666666666666666662 @Pp2( @Pp @Pp @Pp @Pp @Pp @Pp8XVOJQJ_HmHnHsHtHJJNormaldCJ_HaJmHsHtHA Fonte parg. padroTiTTabela normal4l4a,k ,Sem listaPK![Content_Types].xmljEr(Iw},-j4wP-t#b{UTUhd})*1PW)T9l#$yi};@(Hu*Dz/$X3aZ,Dj3bi3?/[G!-Rk.s..a?PK!6_rels/.relsj}Q%v/C/}(hO= C?hv=%[xp{_P1HORBdJE4b$q_6LR7O,En7Lib/SePK!kytheme/theme/themeManager.xmlM @}w7c(EbCA7KY,e.,H,lxIsQ}# +!,$j=GW)E+&8PK!.atheme/theme/theme1.xmlYMoE#F{omvGuhF[xw;jf7q7J(/z4IA!35.=D4;IOH]YxME$&;TVIS1V(Z Ym_&JplG@nN&z@Fj$K_PA!&g=!nmreDLC[OF{KFY7qoku)lVgd.[/_v[LXrd8xR{(b4[@2lz &QLb(fXYJ&x,(R7vKZ Ia:?xpxGIXzg=2PCsu=o.G4& h9QLI(q}938ztzHSE+$_b9rQkZViV2n*=8OSyZ:ppH_/P%#:viNEcfYdEBUVWTXEUJg/RAC8D*-Um6]Ptuyz*&Qh*6w+D?CprloSnpJoBc3chTYok#=pGn=wOikZoiBszLPjui&eEEMl8;64HpU)LO3e:(xf)HyrB(-4gfpZa2khN-aT3V4ov/]f$pp@icAs@THNZIZ[}iRYqy$JyH9,AZjyi)D]n%lXlE6ljWYDK/eby_L&WVcJT14fS!:UJA?y6Xg1K#[]y%[BTRlwvSL)4.XtzxCJ#Lw@,e_}aN}jHPT$dfl,YdTI]Zd+zoPnIhYC=!kkl1Qn6MB]-_f MR+Wh1,QH*:[A@V_.ap64+lt7stG5;Mb8s9xjI11qM2%M2K94uo%PK!theme/theme/_rels/themeManager.xml.relsMwoo&56?$Q,.aic21h:qm@RN;do7gK(M&$R(.1rJT8VAHu}$b{P8g/]QAs(#L[PK-![Content_Types].xmlPK-!6+_rels/.relsPK-!kytheme/theme/themeManager.xmlPK-!.atheme/theme/theme1.xmlPK-!theme/theme/_rels/themeManager.xml.relsPK]?xml version=1. encoding=UTF-8 standalone=yes?a:clrMap xmlns:a=http://schemas.openxmlformats.org/drawingml/26/main bg1=lt1 tx1=dk1 bg2=lt2 tx2=dk2 accent1=accent1 accent2=accent2 accent3=accent3 accent4=accent4 accent5=accent5 accent6=accent6 hlink=hlink folHlink=folHlink/+++8@(BS?*-*-*-xA+-@** **+@UnknownG* Times New Roman5Symbol3.* Arial7.{ @CalibriACambria Mathqzz%%!r**2HP$Px2!xxrenato.pennarenato.pennaOh+8DPdltrenato.pennaNormal.dotmrenato.penna2Micro
soft Office Word@F#@xJ@xJ%.+,hpediouro*Ttulo !#$Root EntryFpJ)1TableWordDocumentSummaryInformation(DocumentSummaryInformation8CompObj
}F+Documento do Microsoft Office Word 97-23MSWordDocWord.Document.89q

Alguém sabe como ler arquivos .doc e .pdf no Linux com PHP corretamente ?
Desde já agradeço,
Renato.
Alceu13
Para pdf encontrei este artigo, sera que te ajuda.
classe dompdf
http://alexandrems.wordpress.com/2008/04/09/dompdf/

e este outro artigo , ler doctos Word , pdf
http://cgoncalves.com/ler-pdf-e-documentos-word-com-php/
Renato Penna
Achei a solução, obrigado!

CODE
$pos = strpos($documento,'.');
$tam = strlen($documento);
$qtd_caracteres_extensao = $tam-$pos;
$extensao_arquivo = substr($documento,($pos+1),$qtd_caracteres_extensao);
        
if($extensao_arquivo=="doc")
{
    $conteudo = shell_exec("catdoc $arq");
}
elseif($extensao_arquivo=="pdf")
{
    $conteudo = shell_exec('pdftotext $arq -');
}
Esta é uma versão simplificada de nosso conteúdo principal. Para ver a versão completa com maiores informações, formatação e imagens, por favor clique aqui.
Invision Power Board © 2001-2013 Invision Power Services, Inc.