نصيحة Semalt حول كيفية استخدام التعلم العميق لتحسين علامة العنوان الآلية الخاصة بك



هناك طريقة سريعة لأخذ زمام المبادرة في تصنيف مُحسّنات محرّكات البحث وهي تضمين كلمة رئيسية عالية التصنيف في علامة العنوان الخاصة بهم. وإذا فكرت في الأمر لمدة دقيقة ، ستدرك أنه بالفعل حل ذكي. إذا كانت لديك صفحة يتم تصنيفها بالفعل لكلمة رئيسية دون وجود هذه الكلمة الرئيسية في العنوان ، فتخيل أهمية وجود الكلمة الرئيسية في العنوان. ستتم فهرستك بشكل طبيعي أكثر لهذه الكلمة الرئيسية ؛ ومن ثم تحصل على مرتبة أفضل.

الآن ، إذا أخذنا هذه الكلمة الرئيسية وأضفناها إلى Meta Description الخاصة بك ، فستظهر مميزة في نتائج البحث مما يعني أنه من المحتمل أن ينقر المزيد من مستخدمي محرك البحث. هذا ، بالطبع ، سيفيد الموقع.

تخيل أن سيمالت كان يعمل على موقع إلكتروني به مئات أو آلاف أو ملايين الصفحات. إذا اضطررنا إلى القيام بذلك يدويًا ، فسيستغرق الأمر وقتًا طويلاً وسيصبح مكلفًا بسرعة كبيرة. فكيف إذن يمكننا تحليل صفحتها وتحسين كل عنوان ووصف ميتا؟ الحل هو استخدام آلة. من خلال تعليم الآلة العثور على الكلمات الرئيسية ذات التصنيف الأعلى في كل صفحة ، فإننا نوفر الوقت والتكلفة. يمكن أن يؤدي استخدام الجهاز إلى أداء أفضل وأسرع من فريق إدخال البيانات.

دعونا نعيد تقديم Ludwig من Uber و T5 من Google

من خلال الجمع بين Uber's Ludwig و Google's T5 ، لديك نظام قوي جدًا.

باختصار ، Ludwig هي أداة ML تلقائية مفتوحة المصدر تتيح لمستخدميها تدريب النماذج المتقدمة دون الحاجة إلى كتابة أي رمز.

من ناحية أخرى ، يعد Google T5 إصدارًا متفوقًا من النماذج المصممة على غرار SERT. يمكن لـ T5 تلخيص الأسئلة وترجمتها والإجابة عليها وتصنيف استعلامات البحث بالإضافة إلى العديد من الوظائف الأخرى. باختصار ، إنه نموذج قوي للغاية.

ومع ذلك ، لا يوجد ما يشير إلى أن T5 قد تم تدريبه لتحسين علامة العنوان. لكن ربما يمكننا فعل ذلك ، وإليك الطريقة:
  • نحصل على مجموعة بيانات مدربة مع أمثلة مصنوعة من:
    • علامات العنوان الأصلية بدون الكلمة الرئيسية المستهدفة
    • الكلمات الرئيسية المستهدفة
    • علامات العنوان الأمثل مع الكلمات الرئيسية المستهدفة
  • رمز ضبط T5 والبرامج التعليمية للاستخدام
  • لديك مجموعة من العناوين التي لم يتم تحسينها حتى نتمكن من اختبار نموذجنا
سنبدأ بمجموعة بيانات تم إنشاؤها بالفعل ، وسنقدم دليلًا حول كيفية إنشاء مجموعة البيانات.

كان مؤلفو T5 كرماء بما يكفي لتزويدنا بدفتر مفصل من Google Colab ، والذي نستخدمه لضبط T5. بعد قضاء الوقت في دراسته ، تمكنا من الإجابة على أسئلة التوافه التعسفية. يحتوي دفتر Colab أيضًا على إرشادات حول كيفية ضبط T5 للمهام الجديدة. ومع ذلك ، عندما تنظر إلى تغييرات الكود وإعداد البيانات المطلوبة ، تكتشف أنها تنطوي على الكثير من العمل وأن أفكارنا قد تكون مثالية.

ولكن ماذا لو كان من الممكن أن يكون أبسط؟ بفضل الإصدار 3 من Uber Ludwig ، الذي تم إصداره قبل بضعة أشهر ، لدينا مزيج من بعض الميزات المفيدة للغاية. يأتي الإصدار 3.0 من Ludwig مع:
  • آلية تحسين المعلمة الفائقة التي تستمد أداءًا إضافيًا من النماذج.
  • تكامل خالٍ من الأكواد مع مستودع Hugging Face's Transformers. يتيح ذلك للمستخدمين الوصول إلى النماذج المحدثة مثل GPT-2 و T5 و DistilBERT و Electra لمهام معالجة اللغة الطبيعية. تتضمن بعض هذه المهام تحليل مشاعر التصنيف ، والتعرف على الكيانات المسماة ، والإجابة على الأسئلة ، والمزيد.
  • إنه أحدث وأسرع ونمطي وله خلفية قابلة للتوسيع تعتمد على TensorFlow 2.
  • يوفر دعمًا للعديد من تنسيقات البيانات الجديدة مثل Apache Parquet و TSV و JSON.
  • لديها تمكين التحقق من صحة أضعاف k-fold.
  • عند دمجها مع الأوزان والتحيزات ، يمكن استخدامها لإدارة ومراقبة عمليات التدريب النموذجية المتعددة.
  • يحتوي على نوع بيانات متجه جديد يدعم التسميات المزعجة. يكون هذا مفيدًا إذا كنا نتعامل مع إشراف ضعيف.
هناك العديد من الميزات الجديدة ، لكننا نجد التكامل مع Hugging Face's Transformers كأحد أكثر الميزات المفيدة. يمكن استخدام خطوط أنابيب تعانق الوجه لتحسين جهود تحسين محركات البحث بشكل كبير على العناوين وتوليد الوصف التعريفي.

يعد استخدام خط الأنابيب أمرًا رائعًا لتشغيل التنبؤات على النماذج التي تم تدريبها بالفعل والمتوفرة بالفعل في نموذج bub. ومع ذلك ، لا توجد حاليًا نماذج يمكنها القيام بما نحتاجه للقيام به ، لذلك نقوم بدمج Ludwig و Pipeline لإنشاء عنوان تلقائي رائع ووصف Meta لكل صفحة على موقع الويب.

كيف نستخدم Ludwig لضبط T5؟

هذا سؤال مهم لأننا نحاول أن نظهر لعملائنا بالضبط ما يجري في خلفية موقعهم على الإنترنت. هنا ، هناك كليشيهات تقول ، "استخدام Ludwig لتدريب T5 بسيط للغاية ، يجب أن نفكر في جعله غير قانوني." الحقيقة هي أننا كنا سنفرض رسومًا أعلى بكثير على عملائنا إذا كان علينا توظيف مهندس ذكاء اصطناعي للقيام بالمثل.

هنا ، سوف تكتشف كيف نقوم بضبط T5.
  • الخطوة 1: افتح دفتر ملاحظات جديدًا من Google Colab. بعد ذلك ، نقوم بتغيير وقت التشغيل لاستخدام GPU.
  • نقوم بتنزيل مجموعة بيانات Hootsuite التي تم تجميعها بالفعل.
  • ثم نقوم بتثبيت Ludwig.
  • بعد التثبيت ، نقوم بتحميل مجموعة بيانات التدريب في إطار بيانات الباندا ونفحصها لنرى كيف تبدو.
  • ثم نواجه العقبة الأكثر أهمية ، وهي إنشاء ملف التكوين المناسب.
يتطلب بناء النظام المثالي التوثيق لـ T5 والتجربة والخطأ المستمرين حتى نحصل عليه بشكل صحيح. (سيقطع شوطًا طويلاً إذا تمكنت من العثور على كود Python لإنتاجه هنا.)

تأكد من مراجعة قواميس ميزات الإدخال والإخراج والتأكد من اختيار الإعدادات بشكل صحيح. إذا تم ذلك بشكل صحيح ، فسيبدأ Ludwig في استخدام "t5-small" كنموذج قيد التشغيل. بالنسبة لطرازات T5 الأكبر ، يكون من الأسهل تغيير محور النموذج وربما تحسين جيله.

بعد تدريب نموذج لعدة ساعات ، نبدأ في الحصول على دقة تحقق رائعة.

من المهم أن تلاحظ أن Ludwig يختار تلقائيًا قياسات إنشاء نص مهمة أخرى ، خاصة الحيرة وتحرير المسافة. كلاهما أرقام منخفضة تناسبنا بشكل صحيح.

كيف نستخدم نماذجنا المدربة لتحسين العناوين

إن اختبار نماذجنا هو الجزء المثير للاهتمام حقًا.

أولاً ، نقوم بتنزيل مجموعة بيانات اختبار بعناوين Hootsuite غير مُحسَّنة ظلت غير مرئية بواسطة النموذج أثناء التدريب. ستتمكن من معاينة مجموعة البيانات باستخدام هذا الأمر:

!رئيس

Hootsuite_titles_to_optimize.csv

إنه لأمر مثير للإعجاب أن يتمكن Ludwig و T5 من فعل الكثير مع أي مجموعة تدريب صغيرة ، ولا يتطلبان ضبطًا متقدمًا للمعلمات الفائقة. يكمن الاختبار المناسب في كيفية تفاعله مع الكلمات الرئيسية المستهدفة. ما مدى جودة مزجها؟

إنشاء تطبيق تحسين علامة العنوان باستخدام Streamlight

يجد كتاب المحتوى أن هذا التطبيق مفيد للغاية. ألن يكون من المدهش أن يكون لديك تطبيق سهل الاستخدام لا يتطلب الكثير من المعرفة التقنية؟ حسنًا ، هذا هو بالضبط ما يوجد هنا Streamlight.

تركيبه ، وكذلك استخدامه ، هو سهل جدا. يمكنك تثبيته باستخدام:

! نقطة تثبيت تبسيط

لقد أنشأنا تطبيقًا يستفيد من هذا النموذج. عند الحاجة ، يمكننا تشغيله من نفس المكان حيث نقوم بتدريب نموذج ، أو يمكننا تنزيل نموذج تم تدريبه بالفعل إلى حيث نخطط لتشغيل البرنامج النصي. لقد أعددنا أيضًا ملف CSV بالعناوين والكلمات الرئيسية التي نأمل في تحسينها.

الآن نطلق التطبيق. لتشغيل النموذج ، نحتاج إلى توفير المسار لملف CSV ، الذي يحتوي على العناوين والكلمات الرئيسية التي نأمل في تحسينها. يجب أن تتطابق أسماء أعمدة CSV مع الأسماء أثناء تدريب Ludwig. إذا لم يقم النموذج بتحسين جميع العناوين ، فلا داعي للذعر ؛ الحصول على رقم لائق هو أيضًا خطوة رائعة إلى الأمام.

بصفتنا خبراء في لغة بايثون ، نشعر بالحماس الشديد عند التعامل مع هذا ، لأنه عادة ما يضخ الدم لدينا.

كيفية إنتاج مجموعة بيانات مخصصة للتدريب

باستخدام عناوين Hootsuite ، يمكننا تدريب النماذج التي من شأنها أن تعمل بشكل جيد لعملائنا ولكنها قد تتخلف عن منافسيهم. هذا هو السبب في أننا نضمن أننا ننتج مجموعة البيانات الخاصة بنا ، وإليك كيفية القيام بذلك.
  • نحن نستفيد من بياناتنا الخاصة من Google Search Console أو Bing Webmaster Tools.
  • كبديل ، يمكننا أيضًا سحب بيانات منافسة عملائنا من SEMrush و Moz و Ahrefs ، إلخ.
  • ثم نكتب برنامجًا نصيًا لعلامات العنوان ثم نقسم العناوين التي لا تحتوي على الكلمة الأساسية المستهدفة.
  • نحن نأخذ العناوين التي تم تحسينها باستخدام الكلمات الرئيسية ونستبدل الكلمات الرئيسية بالمرادفات ، أو نستخدم طرقًا أخرى بحيث يكون العنوان "deoptimized".

خاتمة

سيمالت هنا لمساعدتك على تحسين علامات العنوان الخاصة بك وكذلك الأوصاف التعريفية تلقائيًا. من خلال القيام بذلك ، يمكنك الاستمرار في SERP. لا يعد تحليل موقع الويب مهمة سهلة أبدًا. هذا هو السبب في أن تدريب آلة لمساعدتنا على القيام بذلك لا يوفر التكلفة فحسب ، بل يوفر الوقت أيضًا.

في Semalt ، هناك متخصصون سيقومون بإعداد مجموعة البيانات الخاصة بك ، Ludwig ، و T5 حتى تتمكن من الاستمرار في الفوز دائمًا.

يقدم لنا دعوة اليوم.

mass gmail