FastBots: создайте собственную XML-карту сайта WordPress для обучения вашего AI-бота
Martech Zone содержит тысячи статей, многие из которых устарели. Я работал над сайтом несколько лет и удалил или обновил сотни статей, но у меня осталось еще много. В то же время я хотел бы обучить бота на естественном языке своим контентом, но меньше всего мне хочется обучать его устаревшим статьям.
Фастботы - это ChatGPT— конструктор ботов, которого вы можете изначально обучить, используя карту сайта (или другие варианты). Мне нужна была отфильтрованная карта сайта, включающая все статьи, измененные с определенной даты. Кроме того, я хотел включить свои страницы и аббревиатуры (пользовательский тип сообщения). Я не хотел включать страницы архива для категорий и тегов или иметь свою домашнюю страницу, поскольку это тоже архив.
Используя код, который я привожу в конце этой статьи; Я создал собственный плагин WordPress, который создает собственный XML Карта сайта, которая динамически обновляется каждый раз, когда я публикую сообщение. У FastBots нет автоматического метода переобучения, поскольку я публикую каждую статью, но это отличная отправная точка для использования платформы.
Карта сайта импортирует все ссылки для обучения AI Бот на:
Все страницы теперь импортированы, и вы можете обучить своего бота соответствующим данным. У вас также есть возможность удалить определенные страницы. FastBots также позволил мне настроить фирменный стиль моего ИИ-бота и даже включить ссылку на соответствующую статью в свой ответ. В платформу также встроен запрос лида.
Платформа работала безупречно… протестировать моего бота можно здесь:
Презентация Martech Zoneэто бот, Марти Создайте своего AI-бота FastBots
Пользовательский XML-карта сайта
Вместо того, чтобы добавлять эту функциональность в свою тему, я создал собственный WordPress плагин для создания карты сайта. Просто добавьте каталог в папку плагинов, а затем PHP файл со следующим кодом:
<?php
/*
Plugin Name: Bot Sitemap
Description: Dynamically generates an XML sitemap including posts modified since a specific date and updates it when a new article is added.
Version: 1.0
Author: Your Name
*/
// Define the date since when to include modified posts (format: Y-m-d)
$mtz_modified_since_date = '2020-01-01';
// Register the function to update the sitemap when a post is published
add_action('publish_post', 'mtz_update_sitemap_on_publish');
// Function to update the sitemap
function mtz_update_sitemap_on_publish($post_id) {
// Check if the post is not an auto-draft
if (get_post_status($post_id) != 'auto-draft') {
mtz_build_dynamic_sitemap();
}
}
// Main function to build the sitemap
function build_bot_sitemap() {
global $mtz_modified_since_date;
$args = array(
'post_type' => 'post',
'date_query' => array(
'column' => 'post_modified',
'after' => $mtz_modified_since_date
),
'posts_per_page' => -1 // Retrieve all matching posts
);
$postsForSitemap = get_posts($args);
// Fetch all 'acronym' custom post type posts
$acronymPosts = get_posts(array(
'post_type' => 'acronym',
'posts_per_page' => -1,
));
// Fetch all pages except the home page
$pagesForSitemap = get_pages();
$home_page_id = get_option('page_on_front');
$sitemap = '<?xml version="1.0" encoding="UTF-8"?>';
$sitemap .= '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">';
foreach($postsForSitemap as $post) {
setup_postdata($post);
if ($post->ID != $home_page_id) {
$sitemap .= '<url>'.
'<loc>'. get_permalink($post) .'</loc>'.
'<lastmod>'. get_the_modified_date('c', $post) .'</lastmod>'.
'<changefreq>weekly</changefreq>'.
'</url>';
}
}
foreach($acronymPosts as $post) {
setup_postdata($post);
if ($post->ID != $home_page_id) {
$sitemap .= '<url>'.
'<loc>'. get_permalink($post) .'</loc>'.
'<lastmod>'. get_the_modified_date('c', $post) .'</lastmod>'.
'<changefreq>weekly</changefreq>'.
'</url>';
}
}
foreach($pagesForSitemap as $page) {
setup_postdata($page);
if ($page->ID != $home_page_id) {
$sitemap .= '<url>'.
'<loc>'. get_permalink($page) .'</loc>'.
'<lastmod>'. get_the_modified_date('c', $page) .'</lastmod>'.
'<changefreq>monthly</changefreq>'.
'</url>';
}
}
wp_reset_postdata();
$sitemap .= '</urlset>';
file_put_contents(get_home_path().'bot-sitemap.xml', $sitemap);
}
// Activate the initial sitemap build on plugin activation
register_activation_hook(__FILE__, 'build_bot_sitemap');