"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > كيفية إجراء مطابقة غامضة لعناوين البريد الإلكتروني وأرقام الهواتف باستخدام Elasticsearch؟

كيفية إجراء مطابقة غامضة لعناوين البريد الإلكتروني وأرقام الهواتف باستخدام Elasticsearch؟

تم النشر بتاريخ 2024-11-07
تصفح:416

How to Perform Fuzzy Matching of Email Addresses and Telephone Numbers Using Elasticsearch?

مطابقة غامضة للبريد الإلكتروني أو الهاتف باستخدام Elasticsearch

يوفر Elasticsearch إمكانات مدمجة للمطابقة الغامضة لعناوين البريد الإلكتروني وأرقام الهواتف.

مطابقة البريد الإلكتروني

لمطابقة عناوين البريد الإلكتروني التي تنتهي بنطاق معين (على سبيل المثال، @gmail.com):

{
    "query": {
        "term": {
            "email": ".*@gmail.com"
        }
    }
}

أو لمطابقة رسائل البريد الإلكتروني التي تحتوي على سلسلة محددة:

{
    "query": {
        "match": {
            "email": {
                "query": "sales@*",
                "operator": "and"
            }
        }
    }
}

مطابقة الهاتف

للحصول على مطابقة غامضة لأرقام الهواتف، يمكنك استخدام النمط التالي:

{
    "query": {
        "prefix": {
            "tel": "136*"
        }
    }
}

سيؤدي هذا إلى مطابقة جميع أرقام الهواتف التي تبدأ بـ "136".

تحسين الأداء

لتحسين الأداء للمطابقة الغامضة، فكر في استخدام أدوات تحليل مخصصة تستفيد من n-gram أو مرشحات رمز الحافة n-gram. تقوم عوامل التصفية هذه بتقسيم النص إلى رموز أصغر، مما يسهل على Elasticsearch إجراء مطابقة غامضة.

تكوين محلل البريد الإلكتروني:

{
  "settings": {
    "analysis": {
      "analyzer": {
        "email_analyzer": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "name_ngram_filter",
            "trim"
          ]
        }
      },
      "filter": {
        "name_ngram_filter": {
          "type": "ngram",
          "min_gram": "3",
          "max_gram": "20"
        }
      }
    }
  }
}

تكوين محلل الهاتف:

{
  "settings": {
    "analysis": {
      "analyzer": {
        "phone_analyzer": {
          "type": "custom",
          "char_filter": [
            "digit_only"
          ],
          "tokenizer": "digit_edge_ngram_tokenizer",
          "filter": [
            "trim"
          ]
        }
      },
      "char_filter": {
        "digit_only": {
          "type": "pattern_replace",
          "pattern": "\\D ",
          "replacement": ""
        }
      },
      "tokenizer": {
        "digit_edge_ngram_tokenizer": {
          "type": "edgeNGram",
          "min_gram": "3",
          "max_gram": "15",
          "token_chars": [
            "digit"
          ]
        }
      }
    }
  }
}
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3