Частотный словарь русского языка
Вторая версия частотного списка
На этой странице Вы можете получить списки наиболее частотных слов русского языка. До настоящего времени Частотный словарь русского языка под ред. Л.Н.Засориной (1977) чаще всего использовался в качестве источника информации о частоте русских слов. Однако корпус, на основе которого была подсчитана частота слов в этом словаре, по современным стандартам очень мал (около миллиона слов). Кроме того, список существенно устарел: он соответствует частоте использования слов в период с 20-х до 60-х годов. В результате корпус включает большое число идеологических источников, например, произведения Ленина и Калинина, Материалы 22 и 23 съездов КПСС, советские газеты. Слова советский и товарищ входят в первую сотню русских слов, наряду со служебными словами (они встречаются чаще слов где, здесь, ваш ), слова партия, революция, коммунистический встречаются чаще чем назад, около, лучше и т.д. Наконец, список слов из словаря Засориной не существует в электронном виде.
Список слов, доступный с этой страницы, содержит примерно 35000 слов с частотой большей 1 ipm (вхождений на миллион слов, instances per million words). Имеется также более короткий список из 5000 наиболее частотных русских слов. Списки используют кодировку кириллицы Windows-1251 и упакованы утилитой WinZip (пользователи Linux или Mac могут использовать StuffIt для распаковки).
Слова с частотой больше 1 ipm
Список 5000 наиболее частых слов
Некоторые статистические данные об использовании русских слов
Более полная информация о соответствии между частотой слова и покрытием корпуса находится здесь.
Список построен на основе представительного корпуса современного русского языка. Он включает в себя подборку современной прозы, политических мемуаров, современных газет и научно-популярной литературы (около 40 миллионов слов, проза составляет примерно чуть больше половины объема). Все тексты корпуса были написаны на русском в промежутке между 1970 и 2002; большинство между 1980 и 1995, газетный корпус 1997-1999 (корпус основан на текстах из Библиотеки Мошкова и корпуса современной публицистики А.В.Баранова).
Хорошо известно, что большие тексты представляют проблему для составления частотных списков, поскольке относительно длинный текст может содержать большое количество вхождений некоторого редкого слова, что существенно увеличит его частоту в итоговом списке. Например, корпус, использованный для составления данного списка, содержит вариацию на тему Толкиеновского «Повелителя Колец» (автор Ник Перумов). Несмотря на то, что длина этого романа составляет 250 тыс.слов, менее одного процента всего корпуса, частота использования слова хоббит в этом романе ставит его в первую тысячу русских слов, если частоту считать по всем текстам без ограничений на их длину. По этой причине частотные списки были составлены при условии, что выборка из больших текстов ограничена 10 тыс. слов, и выборка из текстов одного автора составляет менее 100 тыс. слов. В результате подмножество полного корпуса, использованное при подсчете частоты, составляет около 16 миллионов слов.
Корпус, средства для работы с ним, а также параллельный англо-русский корпус (выравнение на основе предложения) описаны, в частности, в следующей публикации автора:
Sharoff, Serge, (2002). Meaning as use: exploitation of aligned corpora for the contrastive study of lexical semantics. Proc. of Language Resources and Evaluation Conference (LREC02). May, 2002, Las Palmas, Spain. PDF file.
Также отдельные частотные списки есть для следующих классов слов:
Создание корпуса, разработка соответствующих программных средств и частотных списков были поддержаны грантом, предоставленным автору Фондом имени Гумбольдта, Германия. Лемматизация для анализа словоформ в корпусе была проведена с помощью морфологического анализатора Диалинг. Поскольку многие словоформы неоднозначны (например, дорогой, были, стали, для, три, уже ), частота некоторых слов не вполне достоверна, например, для рассматривалось как глагол, только если за ним не следует существительное, прилагательное или местоимение, стали всегда рассматривалось как существительное, для супруги всегда выбиралось супруга при возможных супруг и супруги (мн.ч). Критериями для выбора словоформы служили:
Предложения и замечания просьба присылать автору.
Источник
5000 слов русского языка
Автор-составитель Владимир Струг
Создано в интеллектуальной издательской системе Ridero
О чем эта книга
Как моментально увеличить свой словарный запас на 5000 слов? Легко и просто. Нужно воспользоваться чит-кодами, как это делают «читеры» в компьютерных играх. То есть нам надо «сжульничать» с помощью чит-кодов, и без особых усилий улучшить свои навыки. Эта книга как раз один из таких чит-кодов. Она поможет легко увеличить ваш словарный запас на 5000 слов. «Читерство» это хорошо.
Данная книга называется «5000 слов одинаковых на русском и английском языках», но в этой книге содержаться не только одинаковые слова в двух языках, но и очень похожие слова, а также слова отдаленно похожие друг на друга. В некоторых словах были сделаны небольшие изменения в их переводе, чтобы легче было запомнить перевод конкретного слова. Также в некоторых случаях выбран менее используемый вариант перевода слова, но наиболее похожий на слово на другом языке.
Большинство слов из книги не входят в список топ самых используемых, но их знание будет большим подспорьем в пополнении словарного запаса и в изучении иностранного языка.
В книге нет имён, фамилий, географических наименований, национальностей, брендов, слов во множественном числе и т.д., но в перспективе для них можно создать отдельную книгу.
Какие бывают одинаковые слова
1) Полностью идентичные по написанию в обоих языках слова. Например Sport – спорт.
3) А → S. – Вместо русской конечной «а» в английском произносится «s». Как правило, это слова, обозначающие какой-либо вид деятельности, сферу науки или совокупность средств (предметов) похожего назначения. Например physics – физика.
4) А →/ эй / – Слова похожие по написанию, но отличаются по произношению. В них А читается как эй. Например Date [дэйт] – дата.
7) «-ГИЯ» → «джи» – таких слов около 10 000. Вместо русского конечного «-гия» в английском произносим «джи». Пример Methodology [мэсэдо́лэджи] – методология
8) Г→Х – таких слов несколько сотен. В некоторых словах мы вместо русской «г» в английском произносим «х». Пример Hematoma [химэ́тоума] – гематома
9) Ц→ С – таких слов несколько сотен. В таких словах вместо русской «ц» в английском произносим «с», более того – в английском языке вообще нет звука [ц]. Пример Pesticide [пэ́стисайд] – пестицид
10) И→АЙ – таких слов несколько сотен. В таких словах вместо русской «и» в английском произносим «ай». Пример Client [кла́йэнт] – клиент
Подобных правил ещё много, например в каких-то словах добавляются приставки, в каких-то добавляется отрицание, в каких-то добавляются различные окончания и т. д.
Перспективы развития книги
Есть ли в этой книге ошибки? Конечно есть, и в перспективе книга будет улучшаться и будет минимизироваться количество ошибок.
Почему только 5000 слов? 5000 это не предел. Если учитывать имена, географические наименования, национальности, бренды и многое другое, то в перспективе можно собрать список в 150 тысяч слов. Но пока не будем заглядывать так далеко, и попробуем собрать хотя бы 10 000 слов в следующей книге.
Планируется ли составление каких-либо других списков слов? Да конечно. Планируется составить несколько подобных словарей на различные темы. Например будет составляться как общий словарь по всем темам с большим количеством слов, так и отдельный словарь по брендам, отдельный словарь по географическим наименованиям, отдельный словарь по топовым словам и т.д..
Есть ли смысл в этой книге, если показанные в книге слова каждый итак знает? Во-первых, человек не всегда знает о том, что известное ему слово в английском языке звучит примерно так же как и на его родном языке. Во-вторых, в книге все похожие слова собраны в одном месте, и поэтому это удобно для периодического их повторения.
Почему в книге русская транскрипция? При разработке данного словаря я пытался его максимально упростить, чтобы его мог понять даже 3-х летний ребёнок, поэтому и использована только русская транскрипция. Если не находил транскрипцию в открытых источниках, то придумывал её сам. Старался ориентировать транскрипцию на американский вариант английского языка. В дальнейших словарях буду придерживаться данного правила.
Для чего вы вообще создали эту книгу? Эта книга создана для упрощения жизни и для экономии времени.
Как отблагодарить автора
Данная книга стоила мне сотни и сотни часов затраченного мной времени на поиск, обработку и стандартизацию похожих слов на русском и английском языках, именно поэтому эта книга распространяется совершенно бесплатно. Но так как мы живем в век капитализма, то каждому за неё надо заплатить. Плата добровольная и может быть совершенно различной, и не обязательно это должны быть деньги.
Как вы можете мне помочь:
– Вы можете совершить небольшое пожертвование, и как это сделать можно посмотреть вот здесь https://vk.com/strughelp
– Вы можете поделиться данной книгой с друзьями, тогда она принесёт много больше пользы большему количеству людей. Найти ссылки, которыми можно поделиться с друзьями, вы можете вот здесь https://vk.com/similarwords5000
– Вы можете просто рассказать друзьям, что есть вот такая вот замечательная книга с такой вот потрясающей идеей, которая экономит сотни и сотни часов вашей жизни.
– Вы можете прислать свой набор слов, которые вы не нашли в этой книге, и которые обязательно должны войти в следующую книгу. Либо можете прислать ссылку на замечательный сайт с таким набором слов. Присылать на стену в группу https://vk.com/similarwords или в сообщения группы.
– Вы можете подписаться на один из моих пабликов или ютуб-канал. Список пабликов можно посмотреть вот здесь https://vk.com/struggroups
– Вы можете заказать печатный вариант данной книги. По данному вопросу писать вот сюда https://vk.com/vladimirstrug
– Вы можете предложить свою помощь в других моих проектах. https://vk.com/strugprojects
– Вы можете предложить свою какую-либо иную помощь. Писать сюда https://vk.com/vladimirstrug
Одинаковые слова из списка 3000 самых распространенных слов
Abortion [э’боршэн] – аборт, абортация, прерывание
Absolute [«эбсэ, лут] – абсолют, совершенство, совершенный, чистый
Absolutely [,эбсэ’лутли] – абсолютно
Absorb [эб’зорб] – абсорбировать, поглощать
Academic [э’кэдэмик] – академический
Accompany [э’кампэни] – аккомпанировать, сопровождать
Account [э’кaунт] – аккаунт
Accurate [«экьэрэт] – аккуратный
Act [экт] – акт, действие, действовать
Active [«эктив] – активный
Activist [«эктэвэст] – активист
Activity [эк’тивэти] – активность
Actor [«эктэр] – актер
Actress [«эктрэс] – актриса
Actual [«экчуэл] – актуальный, действительный
Actually [«экчуэли] – актуально, фактически, в настоящее время
Adapt [э’дэпт] – адаптировать, приспособить, переделать
Address [«э, дрес] – адрес, адресовать
Administration [эд, мини’стрейшэн] – администрация
Administrator [эд’минэ, стрейтэр] – администратор
Advocate [«эдвэкэт] – адвокат, защищать, отстаивать
Affect [э’фект] – аффект
Agency [«ейджэнси] – агентство
Agent [«ейджэнт] – агент
Aggressive [э’гресив] – агрессивный
Agricultural [эгрэ’калчэрэл] – агрокультурный, сельскохозяйственный
Airline [«ер, лайн] – авиалиния, авиакомпания
Airport [«ер, порт] – аэропорт
Album [«элбэм] – альбом
Alcohol [«элкэ, хал] – алкоголь
Alliance [э’лайэнс] – альянс, союз
Alternative [ол’тёрнэтив] – альтернатива, альтернативный
Analysis [э’нэлэсэс] – анализ
Analyst [«энэлэст] – аналитик
Analyze [«энэ, лайз] – анализировать
Announce [э’наунс] – анонсировать, объявлять
Apartment [э’партмэнт] – апартамент, квартира
Appeal [э’пил] – апелляция, апелляция, апеллировать
Apple [«эпэл] – яблоко
Architect [«аркэ, тект] – архитектор
Argument [«аргьэмэнт] – аргумент, спор
Arrest [э’рест] – арест, арестовать
Article [«артэкэл] – артикль
Artist [«артэст] – артист театра, художник
Artistic [ар’тистик] – артистический, художественный
Aspect [«э, спект] – аспект, взгляд, точка зрения
Assign [эсэйн] – ассигновать, назначать
Assist [э’сист] – ассистировать, помочь, помогать
Assistance [э’систэнс] – ассистенция, помощь, ассистент
Assistant [э’систэнт] – ассистент, помощник
Associate [э’соусиэт] – ассоциировать, соединять, присоединять
Association [э, соуси’ейшэн] – ассоциация
Athlete [«э, слит] – атлет, спортсмен
Athletic [э’слетик] – атлетический, спортивный
Atmosphere [«этмэ, сфир] – атмосфера
Attack [э’тэк] – атаковать, атака
Attribute [«этрэ, бьют] – атрибут, признак, свойство
Audience [«адиэнс] – аудиенция, аудитория, публика
Author [«осэр] – автор
Authority [э’сорэти] – авторитет, власть
Auto [«отоу] – авто, автомобиль
Balance [«бэлэнс] – баланс, равновесие
Bank [бэнк] – банк, берег
Bar [бар] – бар, брусок
Barrel [«бэрэл] – баррель
Barrier [«бэриэр] – барьер, преграда
Baseball [«бейс’бол] – бейсбол
Basis [«бейсэс] – базис, основа, основание
Basketball [баскитбол] – баскетбол
Battery [«бэтэри] – батарея
Bear [бер] – берлога, медведь
Bible [«байбэл] – библия
Billion [«бильэн] – билион, миллиард
Biological [,байэ’ладжикэл] – биологический
Block [блак] – блок, квартал
Boat [боут] – ботик, бот, лодка
Bombing [«бамин] – бомбардировка
Boom [бум] – бум, заграждение
Boot [бут] – ботинок, сапог, бутса бутса
Boss [бас] – босс, хозяин
Bottle [«батэл] – бутылка
Bowl [боул] – боулинг, играть в шары, ходить в кегельбан, катать (шар, колесо)
Box [бакс] – бокс, ящик
Boyfriend [«бой, френд] – бойфренд
Brand [брэнд] – бренд, название марки
Brilliant [«брильэнт] – бриллиант, блестящий
Brother [«бразэр] – брат
Budget [«баджит] – бюджет
Business [«бизнэс] – бизнес, дело
Cabin [«кэбэн] – кабина, каюта
Cabinet [«кэбэнэт] – кабинет, шкаф
Cable [«кейбэл] – кабель, кабельный
Calculate [«кэлкьэ, лейт] – калькулировать, вычислять
Camera [«кэмэрэ] – фотокамера, фотоаппарат
Camp [кэмп] – кемпинг, лагерь, стоянка
Campaign [кэм’пейн] – кампания, поход
Campus [«кэмпэс] – кампус
Candidate [«кэндэдейт] – кандидат
Capital [«кэпэтэл] – капитал, капиталист
Captain [«кэптэн] – капитан
Car [кар] – кар, автомобиль
Card [кард] – карточка
Career [кэ’рир] – карьера
Carrier [«кэриэр] – курьер, носильщик, подносчик, посыльный, рассыльный
Category [«кэтэ, гори] – категория, разряд, класс, рубрика, номинация
Catholic [«кэслик] – католик
Center [«сентэр] – центр
Central [«сентрэл] – центральный
Ceremony [«серэ, моуни] – церемония
Challenge [«чэлэндж] – челендж, вызов, вызывать
Champion [«чэмпиэн] – чемпион, победитель, защитник, поборник, борец, сторонник
Channel [чэнэл] – канал
Character [«кериктэр] – характер
Characteristic [,керэктэ’ристик] – характеристика
Characterize [«керэктэ, райз] – характеризовать
Chef [шеф] – шеф-повар
Chemical [«кемэкэл] – химический
Chocolate [«чоклэт] – шоколад
Cholesterol [кэ’лестэ, рол] – холестерин
Christian [«крисчэн] – христианин, христианский
Cigarette [,сигэ’рет] – сигарета
Cite [сайт] – цитировать
Classic [«клэсик] – классический
Classroom [«клэс, рум] – класс, классная комната
Client [«клайэнт] – клиент
Climate [«клаймэт] – климат
Clinic [«клиник] – клиника, больница, лечебница
Clinical [«клинэкэл] – клинический
Clue [клу] – ключ (к разгадке) ключ
Cluster [«кластэр] – кластер
Coach [коуч] – коуч, тренер личностного роста, тренер, инструктор
Coalition [,коуэ’лишэн] – коалиция
Cognitive [«кагнитив] – когнитивный, познавательный
Cold [колд] – холодно, холод
Collapse [кэ’лэпс] – коллапс, крушение, крах, рушиться, потерпеть крах
Colleague [«калиг] – коллега
Collect [кэ’лект] – коллекционировать, собирать
Collection [кэ’лекшэн] – коллекция
Collective [кэ’лектив] – коллектив, коллективный
College [«калидж] – колледж
Colonial [кэ’лоуниэл] – колониальный
Combination [,камбэ’нейшэн] – комбинация, сочетание
Combine [«камбайн] – комбайн, комбинировать, объединять, совмещать
Comedy [«камэди] – комедия
Comfort [«камфэрт] – комфорт, удобство, утешение, утешать
Comfortable [«камфэртэбэл] – комфортный, комфортабельный
Command [кэ’мэнд] – команда
Commander [кэ’мэндэр] – командор, командир
Comment [«камент] – комментарий, комментировать
Commercial [кэ’мёршэл] – коммерческий
Commission [кэ’мишэн] – комиссия
Committee [кэ’мити] – комитет
Common [комэн] – коммуна, общий
Communicate [кэм’йунэ, кейт] – коммуницировать, общаться, коммуникатор
Communication [кэм, йунэ’кейшэн] – коммуникация, связь
Community [кэм’йунэти] – коммуна, община
Company [«кампэни] – компания, общество
Complex [«камплекс] – комплексный, сложный
Component [кэм’поунэнт] – компонент
Compose [кэмпеуз] – композировать, составлять, сочинять, композиция
Composition [,кампэ’зишэн] – композиция, сочинение
Computer [кэм’пьютэр] – компьютер
Concentrate [«кансэн, трейт] – концентрат, сосредотачиваться
Concentration [,кансэн’трейшэн] – концентрация, сосредоточенность
Concept [«кансепт] – концепт, концепция, понятие
Concert [«кансёрт] – концерт
Concrete [«канкрит] – конкретный
Conduct [«кандакт] – проводить, вести (от кондуктор)
Conference [«канфэрэнс] – конференция
Conflict [«канфликт] – конфликт
Confront [кэнфрант] – конфронтация, стоять лицом к лицу
Confusion [кэн’фьюжэн] – конфуз, смущение
Congress [«кангрэс] – конгресс
Congressional [кэн’грешэнэл] – относящийся к конгрессу
Consensus [кэн’сенсэс] – консенсус
Conservative [кэн’сёрвэтив] – консервативный, консерватор
Constant [«канстэнт] – константа, постоянный
Constantly [«канстэнтли] – константно, постоянно
Constitutional [,канстэ’тушэнэл] – конституционный
Construct [кэн’стракт] – сконструировать, соорудить
Construction [кэн’стракшэн] – конструкция
Consultant [кэн’салтэнт] – консультант
Contact [«кан, тэкт] – контакт, контактировать
Contain [кэн’тейн] – содержать (от контейнер)
Container [кэн’тейнэр] – контейнер
Content [«кантент] – содержание, контент
Context [«кантекст] – контекст
Contract [«кан, трэкт] – контракт, договор
Contrast [«кантрэст] – контрастность
Contribution [,кантрэ’бьюшэн] – контрибуция, взнос
Control [кэн’троул] – контроль, контролировать
Convention [кэн’веншэн] – конвенция
Convert [«канвёрт] – конвертировать, превращать
Cooperation [кэоперэйшн] – кооперация, сотрудничество
Cop [кап] – коп, полисмен
Copy [«капи] – копия, копировать
Corn [кор: н] – попкорн, зерно, хлеба, кукуруза, маис
Corporate [«корпэрэт] – корпоративный, общий
Corporation [,корпэ’рейшэн] – корпорация
Correct [кэ’рект] – корректный, правильный, исправлять
Correspondent [,корэ’спандэнт] – корреспондент
Couch [кауч] – кушетка
Council [каунсил] – консилиум, совещание
Cousin [«казэн] – кузен, кузина, двоюродная сестра, двоюродный
Crash [кр: эш] – крах, авария, потерпеть крах, банкротство
Cream [крим] – крем, сливки
Creative [кри’ейтив] – креативный, творческий
Credit [«кредэт] – кредит
Crime [крайм] – криминал, преступление
Criminal [«кримэнэл] – криминал, преступник, уголовный
Crisis [«крайсэс] – кризис
Criteria [край’тириэ] – критерий
Critic [«критик] – критик
Critical [«критикэл] – критичный, критический
Criticism [«крити, сизэм] – критика
Criticize [«крити, сайз] – критиковать
Cross [крос] – крест, пересекать
Cultural [«калчэрэл] – культурный
Culture [«калчэр] – культура
Dance [дэнс] – танцевать
Daughter [«дотэр] – дочь
Dealer [«дилэр] – дилер, торговец
Debate [дэ’бейт] – дебаты, дискуссия
Decade [де’кейд] – декада, группа из десяти, десяток, десятилетие
Declare [ди’клер] – декларировать
Deficit [«дефэсэт] – дефицит
Democracy [ди’макрэси] – демократия
Democrat [«демэ, крэт] – демократ
Democratic [,демэ’крэтик] – демократический, демократичный
Demonstrate [«демэн, стрейт] – демонстрировать
Demonstration [,демэн’стрейшэн] – демонстрация
Department [ди’партмэнт] – департамент, отделение
Depression [ди’прешэн] – депрессия
Deputy [«депьэти] – депутат
Design [ди’зайн] – дизайн, разрабатывать
Designer [ди’зайнэр] – дизайнер, конструктор
Detail [ди’тейл] – деталь
Detailed [ди’тейлд] – детальный
Detect [дитэкт] – обнаруживать (от детектив)
Device [дивайс] – девайс, устройство, девиз
Dialogue [«дайэ, лог] – диалог
Direction [дэ’рекшэн] – дирекция
Director [дэ’ректэр] – директор
Discipline [«дисэплэн] – дисциплина
Discrimination [ди, скримэ’нейшэн] – дискриминация, предпочтение
Discuss [ди’скас] – дискутировать, обсуждать,
Discussion [ди’скашэн] – дискуссия, обсуждение
Display [ди’сплей] – дисплей
Dispute [ди’спьют] – диспут, полемика, обсуждать
Distance [«дистэнс] – дистанция
Distant [«дистэнт] – на дистанции, дальний, далекий
Division [ди’вижэн] – дивизия, подразделение
Doctor [доктэ] – доктор
Document [«дакьэмент] – документ
Dominant [«дамэнэнт] – доминант, господствующий
Dominate [«дамэ, нейт] – доминировать, управлять
Drama [«драмэ] – драма, трагедия
Dramatic [дрэ’мэтик] – драматический
Dramatically [дрэ’мэтикли] – драматично
Driver [«драйвэр] – драйвер
Economic [,екэ’намик] – экономический
Economics [,екэ’намикс] – экономика
Economist [икономист] – экономист
Economy [и’канэми] – экономика
Effect [и’фект] – эффект
Effective [и’фектив] – эффективный, действующий, успешный
Efficiency [и’фишэнси] – эффективность
Elect [илект] – выбирать, выбрать, избирать, избрать (на выборах) (от электорат)
Electric [и’лектрик] – электрический
Electricity [и, лек’трисэти] – электричество
Electronic [и, лек’траник] – электронный
Element [«елэмэнт] – элемент, стихия
Elementary [,елэ’ментри] – элементарный
Email [и’мейл] – эл. адрес
Emission [и’мишэн] – эмиссия
Emotion [и’моушэн] – эмоция
Emotional [и’моушэнэл] – эмоциональный
Energy [«енэрджи] – энергия
Engineer [«енджэ’нир] – инженер
Episode [«епэ, соуд] – эпизод
Era [«ерэ] – эра, эпоха
Essay [эсеи] – эссе, очерк
Ethics [«есикс] – этика
Ethnic [«есник] – этнической
Evolution [,евэ’лушэн] – эволюция
Evolve [и’валв] – эволюционировать
Examination [иг, зэмэ’нейшэн] – экзамен
Examine [иг’зэмин] – экзаменовать, проверять
Expansion [икспэншен] – экспансия, расширение, экспансивный
Experiment [ик’сперэмэнт] – эксперимент
Expert [«експэрт] – эксперт
Expose [икспэуз] – экспозиция, показывать, выставлять напоказ
Express [экспрес] – экспресс
Expression [ик’спрешэн] – экспрессия, выражение чувств
Extensive [икстэнсив] – экстенсивный, обширный
Extra [«екстрэ] – экстра, дополнительный
Extraordinary [ик’стрордэ, нери] – экстраординарный
Extreme [ек’стрим] – экстрим, чрезвычайный, крайность
Extremely [ек’стримли] – экстремально, крайне
Fact [фэкт] – факт, сущность
Factor [«фэктэр] – фактор
Faculty [«фэкэлти] – факультет
False [фо: лс] – фальшь, ложный, лживый, фальшивый
Источник
Списки частотных слов русского языка
Список самых частотных слов любого языка зависит от того материала, на котором эта частота считалась. В данном случае был использован Национальный корпус русского языка. Кроме того, списки, приведённые ниже, предполагают лемматизацию, то есть приведение всех словоформ к их словарной форме, например, все формы были, буду, бывший приведены к форме быть, что в последнем случае может оспариваться некоторыми лингвистами.
Частоты приведены к чмс (частота на миллион словоформ, ipm, instances per million words), что означает, что слово Москва в среднем встречается 452 раза на один миллион слов текста (на основе материалов НКРЯ). В результате лемматизации все слова приведены к нижнему регистру, включая слова, которые в большинстве случаев пишутся с большой буквы.
Три колонки: существительные, глаголы, прилагательные.
Частота | Слово |
---|---|
2369 | человек |
1529 | время |
1490 | год |
1195 | дело |
1119 | жизнь |
1024 | рука |
1005 | день |
839 | слово |
835 | раз |
747 | глаз |
743 | лицо |
724 | место |
670 | дом |
660 | работа |
658 | Россия |
624 | друг |
622 | сторона |
611 | голова |
590 | вопрос |
550 | сила |
543 | мир |
529 | случай |
503 | ребенок |
472 | город |
468 | вид |
463 | страна |
453 | конец |
452 | Москва |
449 | бог |
442 | часть |
Частота | Слово |
---|---|
8900 | быть |
2398 | мочь |
2053 | сказать |
1492 | говорить |
1427 | знать |
1291 | есть |
1186 | стать |
849 | хотеть |
793 | иметь |
758 | видеть |
711 | идти |
669 | думать |
608 | жить |
602 | сделать |
561 | делать |
505 | пойти |
496 | дать |
465 | взять |
455 | смотреть |
453 | спросить |
451 | любить |
439 | понимать |
434 | сидеть |
402 | казаться |
391 | работать |
382 | стоить |
381 | прийти |
380 | понять |
368 | выйти |
359 | давать |
Частота | Слово |
---|---|
876 | новый |
554 | последний |
473 | русский |
456 | хороший |
429 | большой |
373 | высокий |
362 | российский |
339 | молодой |
339 | великий |
326 | старый |
317 | главный |
312 | общий |
308 | маленький |
303 | полный |
266 | настоящий |
265 | разный |
263 | белый |
258 | государственный |
241 | далекий |
237 | черный |
231 | нужный |
226 | известный |
224 | советский |
223 | целый |
213 | живой |
210 | сильный |
209 | военный |
См. также
Литература
Смотреть что такое «Списки частотных слов русского языка» в других словарях:
Самое длинное слово русского языка — Решение проблемы того, какое слово в русском языке является самым длинным (и даже ответ на вопрос о том, имеет ли вообще эта проблема решение), зависит от нескольких факторов. Содержание 1 Критерии 2 Условия выбора 2.1 Форма слов … Википедия
Национальный корпус русского языка — URL: http://ruscorpora.ru/ Коммерческий: нет Тип сайта: образовательный/научный проект Реги … Википедия
Частотный словарь — (или частотный список) набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов… … Википедия
Русский язык — У этого термина существуют и другие значения, см. Русский язык (значения). Русский язык Произношение: ˈruskʲɪj jɪˈzɨk … Википедия
Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле: где Freqx частотность слова «x», Qx количество словоупотреблений слова «x», Qall общее количество словоупотреблений. В… … Википедия
НКРЯ — Национальный корпус русского языка общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/. Содержание 1 Составители 2 Состав корпуса … Википедия
словарь лингвистический — Словарь, в котором дается разъяснение значения и употребления слов (в отличие от энциклопедического словаря, сообщающего сведения о соответствующих реалиях предметах, явлениях, событиях). Диалектный (областной) словарь. Словарь, содержащий… … Словарь лингвистических терминов
Медицина — I Медицина Медицина система научных знаний и практической деятельности, целями которой являются укрепление и сохранение здоровья, продление жизни людей, предупреждение и лечение болезней человека. Для выполнения этих задач М. изучает строение и… … Медицинская энциклопедия
Источник