Zipf заңының мәтіндік анализі дегеніміз не

Мазмұны:

Zipf заңының мәтіндік анализі дегеніміз не
Zipf заңының мәтіндік анализі дегеніміз не

Бейне: Zipf заңының мәтіндік анализі дегеніміз не

Бейне: Zipf заңының мәтіндік анализі дегеніміз не
Бейне: The Zipf Mystery 2024, Сәуір
Anonim

Іздеу жүйелері жыл сайын ақылды бола түсуде. Егер олар таяу уақытқа дейін тек түйінді сөздердің тығыздығы мен өзектіліктің біршама шайқалатын индикаторын ескеретін болса, енді мақаланың жоғары деңгейге өтуінің маңызды шарттарының бірі мәтіннің табиғилығына айналды. Оны Zipf заңына сәйкес талдау арқылы бағалауға болады.

Zipf заңының мәтіндік талдауы дегеніміз не
Zipf заңының мәтіндік талдауы дегеніміз не

Зипф заңы бойынша мәтін қалай талданады?

Іздеу жүйесінің тетіктері жасанды түрде жасалған мәтін табиғи емес деп танылып, іздеу нәтижелерінің жоғарғы позицияларынан алынып тасталынады. Мәтіннің табиғилық деңгейі қалай анықталады? Американдық лингвист Джордж Зипф мәтіннің табиғи болуы заңын шығарды, оған сәйкес мәтіндегі сөздің қолданылу жиілігі оның реттік санына кері пропорционалды. Яғни, екінші сөз біріншіден жартылай жиі кездеседі, үшінші сөз біріншіден үш есе сирек кездеседі және т.б.

Осы қарапайым математикалық әдіске сүйене отырып, кез-келген мәтінді табиғи болу үшін талдауға болады. Осы ережеге сәйкес 30-50 пайызға сәйкес келетін мәтін табиғи болып саналады. Пайыз неғұрлым жоғары болса, соғұрлым мәтін табиғи болып көрінеді. Интернетте қазірдің өзінде Zipf заңы бойынша мәтінді талдауға болатын арнайы онлайн-ресурстар бар. 30 пайыздан төмен индексі бар мақалаларды іздеу жүйелері қабылдамайды.

Zipf бойынша мәтінді талдау нәтижелеріне қалай сенуге болады?

Zipf заңының мәтіндік талдауы - қарапайым ана тілінде сөйлеушінің сөздерді қолдану ерекшеліктерін ескеретін кең таралған статистикалық талдау. Әрине, ережеге қатысты ерекшеліктер бар. Егер сіз белгілі жазушылардың кейбір шығармаларын Зипф заңы бойынша бағалауға тырыссаңыз, айғақ өте таңқаларлық болуы мүмкін. Алайда классиктердің тілі орташа статистикалық сөйлеуге бейім емес.

Мәтінді Zipf бойынша талдау веб-сайттарды ілгерілетуге байланысты немесе басқаларға байланысты болуы керек. Бұл копирайтерлер, веб-бағдарламашылар және SEO оптимизаторлары. Мәтіннің табиғи болуының жоғары қарқыны мақаланы іздеу жүйесінің жоғарғы бөлігінен қамтамасыз етеді. Zipf's Law талдауларымен мәтін жазу үшін кілт сөздерді үлкен үзілістермен қолдану керек екенін есте ұстаған жөн. Көбінесе клиенттер орындаушылардан кілт сөздері бар және белгілі бір пайдалану жиілігі бар мәтіндер құруды талап етеді. Мұндай мәтін Zipf талдауы бойынша төмен баллға ие болатыны сөзсіз. Дұрыс техникалық тапсырма - бұл тапсырыс беруші тек мәтінді қолданудың авторлық авторын шектемей, тек кілттерді өздері береді. Содан кейін қай сөздің мәтінде жиі кездесетінін анықтап, оның қолданылу жиілігін ескере отырып, қалғандарының барлығын мақалада қамтыған жеткілікті.

Ұсынылған: