Американський дослідник Джордж Ципф (насправді Зіф, а не як ми взяли в московській мові) вивів закон свого імені, лінгвостатистичний закон Ципфа (Зіфа), який говорить, що відношення рангу слова в частотному словнику до частотності слова в мові становить постійну величину (константу).
Насправді, не все так страшно, як здається. Якщо в якомусь досить великому тексті порахувати кількість кожного слова, що вийде: один (перше місце) поділити на кількість першого в списку слова (першого за рангом), два – на кількість другого слова поділити, десять – на кількість десятого і так далі… то це буде приблизно одне й те значення (константа).
Цей закон допоміг встановити осмисленість легендарного рукопису Войнича, він допомагає роботам блокувати гівняні SEO-тексти в інтернеті та інше.
Цікаво, що закон Ципфа працює не лише в лінгвістиці. Якщо, наприклад, взяти всі міста України і скласти список за кількістю населення, то спрацює такий самий принцип, як і зі списком слів в частотному словнику. Тобто відношення рангу міста (його номер у списку) поділити на кількість населення, то отримаємо «статистичну» константу.
Такий ось універсальний світ.