Скольку различных фамилий в Соединенных Штатах Америки?

Как можно хотя бы приблизительно оценить эту величину? Ну конечно же надо взглянуть на последний доступный цензус. Во время написания этой заметки последний доступный цензус был сделанный в году 2000. Там были детально описаны наиболее популярные 150,000 фамилий каждая представляюшая по крайней мере 100 человек принимавших участие в цензусе. Менее популярные имена включены не были. Никакой информации о их количестве я не наблюдал. Полностью вся информация из этого цензуса будет доступна для публики по прошествию 70 лет с опроса, то есть в 2070 году.

На что еще можно обратить внимание? Я подозреваю что лучший источник подобного рода информации (за исключением правительства) - это Facebook. Нам надо просто просканировать все счета людей проживающих в Америке и отфильтровать дупликаты. Потом подсчитать пропорцию. Скажем, мы насчитали X уникальных имен и Y Американских счетов. Тогда приблизительное количество имен в Америке должно быть равно 309,000,000*(X/Y).

К сожалению этот метод требует полного перечисления всех счетов на Facebook, чего бы нам не хотелось сейчас делать. Это безусловно в пределах возможного, но нет ли какого-то более простого, пускай и менее точного метода оценки числа фамилий в США?

Известно что население США в 2000 году было около to 300,000,000. Также известно что 150,000+ отдельных фамилий доступных из цензуса представляют 240,000,000 человек. Остальное население, все 60,000,000, указали фамилии каждое из которых встречается меньше чем 100 раз. Мы не знаем как эти данные распределины. Все что мы можем сделать - это указать верхний и нижний пределы. Возможно но не очень вероятно что эти неизвестные имена также популярны как и последние имена указанный в цензусе, то есть каждое иммет по числу представителей близкой к 100 (но чуть меньше, иначе они были бы указаны в цензусе). В этом случае количество отдельных фамилий в Соединенных Штатах Америке было бы 150,000 + 60,000,000/100 = 750,000. С другой стороны возможно что все имена не указанные в цензусе представляют по одному человеку каждое. В этом случае количество отдельных фамилий в Соединенных Штатах Америке было бы 150,000 + 60,000,000 = 60,150,000. Ни 750,000 ни 60,150,000 не выглядят как очень вероятные оценки но они дают нам нижнюю и верхнюю границы: 750,000 и 60,150,000 уникальных фамилий. Любая попытка уточнить эти два числа так и останется попыткой - нужно глядеть на реальные данные. Давайте предположим что в среднем одна фамиля представляет 50 человек и все распределено очень равномерно.Тогда число отдельных фамилий в США равняется 50,000+60,000,000/50 = 1,350,000. Эти данные приводятся для цензуса 200 года. Более современные данные могут быть получены когда будут доступны ресультаты цензуса 2010 года.


©2015 ANC Labs Inc | Условия использования | Политика конфиденциальности | Смотреть в: Классическом | Мобильном