Cloxy

CloxySEO блогПолзи от XML картата на сайта

Ползи от XML картата на сайта

Как да изградим XML карта на нашия сайт и защо sitemap.xml е важна? Какви са начините, чрез които можем да изпратим XML картата към търсачките? Как да пингваме ново съдържание в сайт чрез sitemap.xml? Още полезни съвети и неща, които трябва да се имат предвид при изграждането на карта на сайта, гледайте в следващото видео.


Налични формати: 720p WebM (VP8) | 360p MP4 (H.264) | 1080p WebM (VP9)

Транскрипция

Здравейте! Аз съм Васил Тошков от Cloxy, а темата днес е "Как да изградим XML карта на нашия сайт и защо XML картата е важна?". Бързам да направя уточнение, че XML карта е различно от HMTL карта на нашия сайт. Ако HTML картата е нещо препоръчително, което може и да нямаме, ако имаме добра структура на сайта си. XML картата е задължителна и след малко ще видите защо.

Първото нещо е, че XML картата е протокол, както са протокол - Schema.org, т.е схемите за Microdata и всякакви други семантики, както са протокол robots.txt, така е протокол и XML картата на сайта. На Адрес - sitemaps.org е описан целия протокол, даже ще видите, че са с еднакъв дизайн, като другите протоколи.

Какво най-общо представлява една XML карта на сайта? Това е един XML, който има главен елемент URLSET. Най-общо казано, въпреки че има някои други тагове, които пропускам, за да е по-прост примера, и URL елементи, които се повтарят до 50 000 пъти. После ще кажа защо.

Те са адресите на сайта, като за всеки един адрес, освен локация, какъв е от нашия сайт, може да има допълнителни незадължителни опционални атрибути, тоест даване на последна модификация на този адрес, приоритет и други подобни. Единственият задължителен е LOC, тоест местоположение на адреса на съответния URL. Моят съвет е да се използва само той предимно, няма нужда от друго. Това нещо се повтаря за всеки един адрес от нашия сайт. Този URL таг.

След като създадем карта на сайта, какво правим с нея? Моят съвет е да я добавим на две ключови места в нашия сайт. Първото е в robots.txt. Robots протоколът позволява със sitemap: да определим къде да е картата ни. Това е пълен път към картата на сайта, за да може, когато дойде, който и да е бот, първото нещо което правят ботовете е да отварят robots.txt.

Все още има такава традиция при тях и освен забраните, които изследват, виждат и къде е картата на сайта за много по-бързо и лесно обхождане на самия сайт, а не чрез някакви други граф методи, а с карта на сайта става много по-ефикасно.

Второто нещо е в Google Webmaster Tools, Bing Webmaster Tools, Yandex Webmaster Tools. Във всякакви такива инструменти за уеб администратори на отделните търсачки, може да си добавите картата на сайта, за да може съответните търсачки отново да я имат предвид. Макар, че и по този начин ще я имат предвид.

Аз винаги съм казвал, че едно нещо трябва да го правим по колкото се може повече начини - да го показваме на търсачката, за да е 100% сигурно, че тя ще го разбере. С robots им го подаваме, чрез съответния Webmaster Tools го подаваме и чрез Ping може да подаваме на всяка една търсачка.

Това е третото нещо, което аз препоръчвам. То е да се ping-ват. XML картите на сайта са единствения начин да се ping-ват стандартизирано всички търсачки. Да, в Google Webmaster Tools вече има начин да извиквате бота и там при инструмента за fetch, но единствения начин да ping-нете всяка една търсачка автоматизирано, без нужда от API-та и такива неща, то е чрез XML карта на сайта.

Преди можеше и чрез RSS фийдът, но знаете, че Google водят някаква абсолютна кампания против RSS-ите, с цел всичко да отива в социалните мрежи. Така че това нещо вече не работи. Вашият сайт трябва да поддържа ping, чрез картата на сайта, тоест трябва да имате карта на сайта задължително, за да може да ping-вате бота, ако я нямате представете си, че аз (обичам да давам този пример) имам един електронен магазин и имате X продукта, рядко добавяте нови продукти, но имате нов топ продукт, който искате да добавите, сега излязъл на пазара и искате да продавате, ако магазинът ви не се обновява много често, добавянето на новия продукт може да се отрази в търсачките след минимум седмица, а може дори и повече време.

Няма нищо лошо да имате ping, да имате карта на сайта на съответния магазин, ping-вате автоматично и идва ботът. Независимо дали е на Google. След малко ще кажа, че могат да се Ping-ват абсолютно всички ботове и индексира целия сайт.

Как става самото ping-ване? Всяка една търсачка, уважаваща себе си и да може да се нарече търсачка, поддържа адрес от следния вид. Адресът на търсачката, примерно google.com, bing.com. Няма значение коя е търсачката. Следва наклонена черта, ping и параметър sitemap, който приема като стойност пълния адрес на картата на сайта.

Водещите търсачки поддържат това нещо и при извикване на този адрес, търсачката идва, дърпа картата на сайта, анализира адресите, вижда някой адрес, ако не е индексиран изобщо и го вкарва по най-бързия начин в индекс. Това нещо трябва да се направи автоматично за всеки един сайт, който има ново съдържание в себе си.

Примерно това видео, което в момента качвам, си има нов URL адрес. В момента, в който публикуваме видеото, картата на сайта се обновява автоматично, динамично. След малко ще кажа, колко е важно да е динамична. Това нещо се извиква автоматично от скриптът, от нашия CMS и по най-бързия начин, буквално, публикувам видеото, влизам в Google и то вече се класира там.

Тук съм си написал някои неща, които е добре да имаме предвид, когато работим с XML карти на сайта.

Първото нещо е, че картата на сайта трябва да е динамична. Не знам защо толкова много се бърка това нещо, но много често виждам как идват клиенти при нас и го питам дали има XML карта на сайта, тъй като примерно не мога да намеря къде е адресът, и те ми казват: "Да, имам. Преди една година колега или инструмент направи карта на сайта ми."

Картата на сайта не е нещо, което се прави веднъж. Тя трябва да е динамична. Да отразява абсолютно в реално време структурата на сайта, тоест пуснем ли нова страница, моментално тя трябва да се появи в картата на сайта. То нали за това е карта на сайта. Така, че тя трябва да се генерира автоматично от самия CMS, който управлява системата, не от някой друг външен инструмент. Трябва да е абсолютно актуално.

Трябва да съдържа само каноничните адреси, тоест една карта на сайта трябва да съдържа само адресите, които искаме да се класират в търсачката. В идеалният случай, това са директории. Не трябва да съдържа адреси с параметри, които са просто преходни тагове, архиви и подобни неща. Би трябвало да съдържа нашата директорийна структура. Аз така и не направих видео за структура на сайт, но това ми е един hint да направя такова нещо.

Вече казахме, ping-ът може да си го интегрирате. За съжаление в никоя система, аз никога не съм видял това нещо да го има, а това е протокол. Протокол означава, че не го използват само търсачките, означава, че е нещо стандартизирано от агенции. Може да се използва за много и различни случаи. Вие трябва да си интегрирате Ping в съответния CMS. Никой CMS по подразбиране не го прави, но не и сложно за направа.

50 хиляди адреса е лимитът, който може да съдържа една карта на сайта. Това е просто по протокол, иначе файлът става прекалено голям и бавен за изтегляне. Ако случайно имате сайт с над 50 хиляди страници, който искате да подадете на търсачките, тогава влизаме в друг сценарии. Правят се няколко карти на сайта, прави се sitemap index, който е нещо като карта-майка, която ги обединява, тя се ping-ва, тя се подава навсякъде, но това е друг случай. Сега нямам време за това нещо.

Ако имате много голяма карта, като този случай, е добре да я компресирате. Протоколът позволява gzip компресия. Може да прочетете на самия протокол как се прави това нещо. Колкото повече компресирате, да махнете празните редове и полета, толкова по-бързо ще се ping-ва вашето съдържание. Това е основната цел при картите на сайта.

Нещо, което съм си записал да кажа и да не забравя - Main root. Тя трябва да се намира в основната директория на вашия сайт, а не в някоя папка, примерно. В противен случай, тя може да няма права, тази карта на сайта, над адреси, които са извън директорията, в която се намира.

Това е за сега. Картите са нещо изключително важно. Както виждате, това е единствения начин да ping-ваме търсачките. Наличието на картите позволява ботовете да дойдат на нашия сайт, да отнемат много по-малко ресурси и да обхождат сайта, спрямо картата, която сме подали, а не по някакви други методи. Тъй като, това нещо е протокол, аз съм сигурен в бъдеще ще изникнат много неща, заради които ще ви трябва XML карта на сайта. Това е. До следващия път! Чао!

бутон за споделяне
Публикувано от на
Средна оценка 4.25 / 5 (4 гласа)

4 коментара

Иван Дочев

Име: Иван Дочев

Дата: 11.05.2015 21:11:44

Оценка: 5 / 5

Как стоят нещата с URL от вида http://www.domain.bg/?m=category&cat=име-на-категория&page=1 . Принципно трябва да се опишат само директории , но в слуай че структурата на сайта ни не е такава и ползваме динамични url адреси. В случая директоярии няма всичко минава през индекса и сменяме само модулацията m=category , m=about .... и параметри.

Васил Тошков

Име: Васил Тошков

Дата: 12.05.2015 07:58:25

Оценка: 4 / 5

В случая каноничния адрес ще е съответния, без параметър "page" отзад. Но това е много грешна структура и първо е редно тя да се оправи, преди да се стигне до изграждане на XML карта на сайта.

Trifon

Име: Trifon

Дата: 12.02.2017 15:06:08

Оценка: 3 / 5

пигването на xml картата на сайта при електронните магазини, добре ли да се автоматизира, например както всички новинарски сайтове които са в G news

Васил Тошков

Име: Васил Тошков

Дата: 13.02.2017 20:36:47

Оценка: 5 / 5

Trifon, при всеки сайт, независимо от типа му, е добре да има пингване на XML картата при ново съдържание.

Добавяне на коментар