Analysez les formats PDF et de fichiers de Word, Excel, Web, livres électroniques, e-mails, archives ZIP pour extraire du texte, des images et des métadonnées à l'aide de l'API REST.
Commencer l'essai gratuitGroupDocs.Parser Cloud pour cURL permet l’analyse et l’extraction de données pour presque tous les formats de documents commerciaux courants. Utilisation de commandes cURL simples ; le texte et les images peuvent être extraits de l’ensemble du document ou d’une plage de pages spécifique. L’API REST prend également en charge les archives telles que ZIP pour être analysées et extraire des images, des informations sur les documents et les détails des éléments du conteneur.
Analyser des PDF, des documents de traitement de texte, des feuilles de calcul et des présentations
Analyser les fichiers modèles Microsoft Word, Excel, PowerPoint et OpenDocument
Parse Macro-Enabled document & templates pour MS Word, Excel et PowerPoint
Extraire le contenu textuel de l’ensemble du document
Extraire du texte et des images de pages spécifiques
Extraire le texte formaté en définissant le mode d’extraction
Extraire le texte des documents dans les archives ZIP ou les e-mails
Récupérez des documents à partir d’e-mails, de portefeuilles PDF et de stockages MS Outlook
Obtenir le nombre de pages du document et d’autres informations
À l’aide de l’API GroupDocs.Parser Cloud, vous pouvez extraire rapidement des images, du texte et des métadonnées du document placé dans votre stockage Cloud. La simple commande cURL suivante montre comment extraire du texte d’un document.
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer TOKEN-HERE" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"foldername/document.docx\", }}"