TOMÁŠ HUBÁLEK BLOG: BAVTE SE PŘIMĚŘENĚ…

Komentáře bez přihlášení a plugin NP_Related jsou zpět…

Written By: Tomáš Hubálek - Feb• 11•09

Udělal jsem na blogu dvě další drobné změny. První z nich je opětovná možnost přidávat komentáře bez nutnosti přihlášení (mám dojem, že frekvence komentování se díky nutnosti přihlašovat se snížila) a druhou změnou je nasazení pluginu NP_Related. U toho se trochu zastavím…

Google Analytics mají funkci benchmarking, kde můžet porovnávat jinými weby podobného zaměření a velikosti. Jedna z metrik, ve které jsem zaostával je Pageview per visit. Abych ji trochu zdvihnul, zkusil jsem nasadit Nucleus Plugin nazvaný NP_Related. Díky němu můžete (bohužel dost primitivně) seskupovat články podle klíčových slov a na konci článku vám pak Blog:CMS nabízí další relativní články.

Výsledek se dostavil (červená šipka označuje den, kdy byl plugin nasazen)…

Bohužel způsob, jakým je NP_Related napsaný, mě moc neuspokojuje. Ke každému článku můžete přiřadit jedno slovo, které se pak hledá v textu i nadpisech článků a pokud se tam najde, článek je relevantní.

Tohle řešení má ale mnoho problémů:

  • plugin nebere v úvahu HTML tagy. Čili, pokud dáte jako klíčové slovo google (a to je díky Picase ve všech obrázcích), najde to skoro všechny články s obrázkem, i když s ním vůbec nesouvisí.
  • plugin nebere v úvahu četnost slov. Prostě slovo je nebo není, nic mezi tím.
  • plugin řadí výsledky podle času, takže některý hodně relevantní článek (podle počtu a umístění klíčových slov) může zůstat mimo “dohled” pluginu.

Velice vážně uvažuju o tom, že tento plugin napíšu znova, nejsem si jistý, jak to ale udělat, abych

  • dosáhl lepších výsledků (dalo se opravdu hovořit o relevanci)
  • stálo to málo času při vývoji

Nechám si, od vás, milí čtenáři poradit, žádné řešení, které přinese výsledky, není zakázané…

Osobně uvažuju o tom, že udělám jakousi verzi invertovaného souboru s váhami podle umístění (v nadpisu, v perexu, v textu a v části klíčové slovo).

Ukázky, jak se parsuje (HTML) text v PHP je např. v článcích

Alternativy k programování jsou:

  • implementovat nějakou knihovnu, která toto umí (žádnou rozumnou jsem nenašel)
  • využít nějakou webovou službu (něco jako related pages)

Bohuže rozumné alternativy jsem zatím nenašel.

You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

Leave a Reply

Your email address will not be published. Required fields are marked *