"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > Comment effectuer une correspondance floue des adresses e-mail et des numéros de téléphone à l'aide d'Elasticsearch ?

Comment effectuer une correspondance floue des adresses e-mail et des numéros de téléphone à l'aide d'Elasticsearch ?

Publié le 2024-11-07
Parcourir:953

How to Perform Fuzzy Matching of Email Addresses and Telephone Numbers Using Elasticsearch?

Correspondance floue d'adresses e-mail ou de téléphone à l'aide d'Elasticsearch

Elasticsearch offre des fonctionnalités intégrées pour la correspondance floue d'adresses e-mail et de numéros de téléphone.

Correspondance d'e-mails

Pour faire correspondre les adresses e-mail se terminant par un domaine spécifique (par exemple, @gmail.com) :

{
    "query": {
        "term": {
            "email": ".*@gmail.com"
        }
    }
}

Ou, pour faire correspondre les e-mails contenant une chaîne spécifique :

{
    "query": {
        "match": {
            "email": {
                "query": "sales@*",
                "operator": "and"
            }
        }
    }
}

Correspondance téléphonique

Pour une correspondance approximative des numéros de téléphone, vous pouvez utiliser le modèle suivant :

{
    "query": {
        "prefix": {
            "tel": "136*"
        }
    }
}

Cela fera correspondre tous les numéros de téléphone commençant par « 136 ».

Optimisation des performances

Pour améliorer les performances de la correspondance floue, envisagez d'utiliser des analyseurs personnalisés qui exploitent n-gram ou filtres de jetons Edge N-gram. Ces filtres décomposent le texte en jetons plus petits, ce qui permet à Elasticsearch d'effectuer plus facilement une correspondance floue.

Configuration de l'analyseur d'e-mail :

{
  "settings": {
    "analysis": {
      "analyzer": {
        "email_analyzer": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "name_ngram_filter",
            "trim"
          ]
        }
      },
      "filter": {
        "name_ngram_filter": {
          "type": "ngram",
          "min_gram": "3",
          "max_gram": "20"
        }
      }
    }
  }
}

Configuration de l'analyseur téléphonique :

{
  "settings": {
    "analysis": {
      "analyzer": {
        "phone_analyzer": {
          "type": "custom",
          "char_filter": [
            "digit_only"
          ],
          "tokenizer": "digit_edge_ngram_tokenizer",
          "filter": [
            "trim"
          ]
        }
      },
      "char_filter": {
        "digit_only": {
          "type": "pattern_replace",
          "pattern": "\\D ",
          "replacement": ""
        }
      },
      "tokenizer": {
        "digit_edge_ngram_tokenizer": {
          "type": "edgeNGram",
          "min_gram": "3",
          "max_gram": "15",
          "token_chars": [
            "digit"
          ]
        }
      }
    }
  }
}
Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3