Extraire des adresses mail d’un pdf ou d’un document

Extraire des adresses mail d’un pdf ou d’un document

Par dans Electronique le 1 septembre 2015

Extraire des adresses mail d’un pdf ou d’un document texte (voire de n’importe quel fichier affichable) peut être une expérience des plus frustrante. L’idée même de devoir chercher et copier/coller le tout, adresse après adresse, suffit à donner de sombres envies dont les claviers ne sortent pas toujours indemnes.

Manipulation simple

Pourquoi ne pas alors utiliser un programme dédié pour faire le job à votre place? Humm… si vous avez déjà essayé de chercher sur le web, de choisir, de tester gratuitement, de payer la version complète, d’apprendre à utiliser plusieurs logiciels pour finalement vous rendre compte qu’ils ne sont pas à la hauteur de la mission, alors vous n’en êtes pas à votre premier lancé de clavier par la fenêtre.

Au final, rien ne vaut une manipulation simple et à la portée de tous.Vieille sagesse électronique

Alors, comment extraire des adresses mail d’un pdf ou d’un document texte ? La réponse est ici (anglais):

Et ci-dessous, en français pour Word 2011 (Mac et Win), avec un truc en plus

1. Copiez/Collez votre document, quel que soit son format (doc, xls, pdf, etc.), dans une page Word.

2. Cliquez Edition > Rechercher > Remplacer. Dans la fenêtre qui s’ouvre à gauche de votre document, cliquez sur l’engrenage puis sur « Recherche et remplacement avancé… »
Extraire des adresses mail d’un pdf ou d’un document

3. Dans le champ « Rechercher », collez cette expression : [A-z,0-9]{1,}\@[A-z,0-9,\.]{1,}

Extraire des adresses mail d’un pdf ou d’un document

4. Cochez la case « Surligner tous les éléments trouvés », puis cliquez la flèche en bas de la fenêtre pour ouvrir les réglage avancés. Une fois ouverts, cochez la case « Utiliser les caractères génériques ».

Extraire des adresses mail d’un pdf ou d’un document

5. Cliquez sur « Rechercher tout » et vous verrez avec ravissement que toutes les adresses mail du document sont désormais sélectionnées.

6. Un petit Ctrl+C (cmd+C pour Mac) et vous pourrez coller l’entier de la liste dans un autre fichier texte (votre clavier vous remerciera).

Le défi des points et des tirets

Seul souci, cette procédure ne marche que si l’adresse mail contient des chiffres et/ou des lettres mais aucun tiret ni point (du type: exemple@exemple.com). Or, la plupart des adresses personnelles comptent – au moins – un point pour séparer le nom du prénom (du type: bernard.exemple@exemple.com).

Pour sélectionner ce type d’adresse, vous pouvez introduire dans le champ « Rechercher » cette expression corrigée: [A-z,0-9]{1,}\.[A-z,0-9]{1,}\@[A-z,0-9,\.]{1,}

Vous remarquerez que je n’ai fait que répéter l’expression utilisée avant le ‘@‘ en la séparant de la première par un ‘.’ On pourra faire de même en combinant un ‘-‘ et un ‘.’ (pour les adresses du type jean-bernard.exemple@exemple.com).

Cette dernière procédure a le mérite d’être fonctionnelle mais le défaut de sentir la bidouille à des kilomètres. Si quelqu’un possède une solution plus élégante, je suis preneur.

2 thoughts on “Extraire des adresses mail d’un pdf ou d’un document

  1. 1

    Un site internet le fait gratuitement en deux clics 🙂
    http://www.captain-extractor.com/

  2. 2

    Bonjour, oui mais il extrait pas le compte juste ! Par contre, j’ai essayé les 2 système et moi le Word inique qu’il n’a trouvé aucun élément.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Facebook IconTwitter IconIMa page Google+IMa page Google+