Получение статистики и уровня читаемости документа. Индекс читабельности: формула и предназначение Что такое индекс читаемости

Главная / Новости хирургии

Когда в Microsoft Word заканчивается проверка правописания, можно вывести на экран сведения об уровне удобочитаемости документа, включая показатели удобочитаемости по следующим тестам:

По умолчанию опция вывода статистики отключена. Чтобы включить ее:

  • Откройте в Word вкладку Файл и выберите пункт Параметры .
  • Выберите пункт Правописание .
  • Убедитесь, что в разделе При исправлении правописания в Word установлен флажок Во время проверки орфографии также проверять грамматику .
  • Установите флажок Показывать статистику удобочитаемости (рис. 1).

Скачать заметку в формате или

Если после этого в документе запустить проверку правописания (вкладка Рецензирование , кнопка Правописание ), то после окончания проверки орфографии появится окно Статистика удобочитаемости (рис. 2). Результаты проверки на удобочитаемость основаны на величине среднего числа слогов в слове и слов в предложении.

Формула расчета показателя удобочитаемости по Флешу:

К = 206,835 – 1,015 x ASL – 84,6 x ASW

где: К – оценка трудности текста, ASL – средняя число слов в предложении; ASW – среднее число слогов в слове.

С целью уточнения коэффициентов в формуле Флеша Оборнева провела исследование средней длины слова в английском и русском языках. Для обеспечения представительности выборки были взяты словарь русского языка под редакцией Ожегова (39 174 слова), и англо-русский словарь под редакцией Мюллера (41 977 слов). Адаптированная для русского языка формула Флеша в интерпретации Оборневой выглядит так:

К = 206,835 – 1,3 x ASL – 60,1 x ASW

К сожалению, напрямую воспользоваться формулой невозможно, так как Word не сообщает число слогов в слове. А формулу, основанную на среднем числе символов в слове, в Интернете найти не удалось. Не известна она и Ирине Владимировне.

Я решил исхитриться, и воспользоваться тем, что формула Флеша является линейным уравнением. Проверка в Word англоязычного текста выводит на экран три параметра: количество слов в предложении, количество слогов в слове и значение удобочитаемости по Флешу. Можно протестировать три текста на английском языке, и в результате получить систему из трех уравнений относительно параметров (a, b, c) формулы Флеша:

К 1 = а – b*ССП 1 – c*ССС 1

К 2 = а – b*ССП 2 – c*ССС 2

К 3 = а – b*ССП 3 – c*ССС 3

где К – оценка трудности текста по Флешу, ССП – среднее число слов в предложении (в тестах 1, 2 и 3), ССС – среднее число символов в слове (также в тестах 1, 2 и 3).

Результат получился неутешительным (абсурдным). Можно предположить, что Word использует нелинейную зависимость, или использование в формуле показателя числа символов вместо числа слогов является некорректным…

И всё же проверить русские тексты на удобочитаемость по Флешу возможно. Рекомендую воспользоваться онлайновыми ресурсами. Например,


Федеральный закон РФ «Об охране здоровья граждан от воздействия окружающего табачного дыма и последствий потребления табака»

Автоматический индекс удобочитаемости (Automatic Readability Index/ARI)

Этот индекс определяет удобочитаемость так: количество знаков делится на количество слов с пробелами, потом количество слов - на число предложений. По ARI тексты бывают 14 уровней удобочитаемости: первый доступен ребенку от 6 до 9 лет, последний - 14-летнему школьнику-американцу. Считается, что к моменту окончания школы выпускник должен свободно понимать тексты 12-го уровня сложности.

СТИХОТВОРЕНИЕ ПУШКИНА «ЗИМНЕЕ УТРО» ПОНЯТНО ДЛЯ ЧИТАТЕЛЕЙ 9–11 ЛЕТ


А.С.Пушкин «Зимнее утро»

Индекс Колмана - Лиау (Coleman - Liau Index)

Индекс Колмана - Лиау, так же как и ARI, учитывает среднее количество знаков и предложений на 100 слов текста. Его часто используют для оценки больших объемов текста: чтобы получить результат, не нужно делить текст на слоги, достаточно с помощью сканера выявить отдельные знаки и границы предложения. При этом полного распознавания символов не требуется.

Текст Задорнова рассчитан на подростков 12–14 лет


М.Задорнов «Умом Россию не поднять»


Простое измерение
сложности текста (Simple Measure of Gobbledygook)

Чтобы определить индекс удобочитаемости, считают число предложений в тексте и количество «сложных слов» (больше трех букв) в каждом. Главный недостаток формулы - получить относительно точный результат можно, если текст длиннее тридцати предложений.

Германа Мелвилла могут прочитать и понять дети
9–11 лет


Г.Мелвилл «Моби Дик, или Белый кит»

Формула Дейла - Челла (Dale - Chall Readability Formula)

Изначально программа ориентировалась на список из 763 слов, которые обязан понимать каждый среднестатистический американский студент к последнему году обучения. Слова, которых в этом списке нет, считаются сложными для понимания. Со временем формула совершенствовалась, и к 1995 году список слов расширился до 3 000 слов.

Текст, который вы только что прочли, доступен для понимания аудитории 15–16 лет


Текст, который вы сейчас читаете

От удаления лишних слов до анализа настроения автора.

Вот небольшая подборка полезных сервисов, которые пригодятся любому человеку, время от времени пишущему связные тексты на русском языке. Они помогут ускорить процесс редактирования и улучшить его итоговый результат.

1. Типограф Лебедева


Этот сервис обрабатывает текст так, чтобы он хорошо смотрелся внутри HTML-кода или верстки. А именно:

  • Меняет английские кавычки на русские;
  • При необходимости заменяет дефис на тире;
  • Соединяет неразрывным пробелом слова с предлогами и союзами, чтобы не было некрасивых переносов.

Подробнее о типографике можно почитать 62-ом параграфе Ководства . Если ваша деятельность каким-то образом связана с наполнением контентом/дизайном сайтов, то настоятельно рекомендую как следует присмотреться к этой книге

2. Главред


Известный копирайтер Максим Ильяхов несколько лет назад создал собственную школу, где учит людей писать в так называемом «инфостиле» - максимально доходчиво и без лишней воды. Для того, чтобы человек мог узнать какие именно слова в его тексте не несут смысловой нагрузки, был разработан этот онлайн-сервис. Он находит газетные штампы, балластовые прилагательные, притяжательные местоимения, модальные глаголы и прочие элементы, избыток которых утомляет читателя.

Максим Ильяхов требует доводить свои работы до оценки не ниже 7 по шкале Главреда. Если она больше 9, то текст может получиться сухим и жестким. Иногда проверяю свои тексты, и, как правило, 6,5 – 7 баллов набирается еще до правок. Но основные проблемы, показанные на скриншоте, кочуют из статьи к статье и портят впечатление от текста. Надеюсь избавиться от них в ближайшее время.

3. Подбор синонимов

Если вы ответственный и трудолюбивый человек, то наверняка стараетесь избегать тавтологии. Этот сервис поможет подобрать похожие по смыслу слова и придать тексту чуть больше художественной выразительности.

4. Счетчик символов

5. Подбор рифм

Не знаю сколько среди читателей сайт поэтов, но без этого сайта подборка была бы неполной. Если у вас есть маленькие дети, то с его помощью можно играть с ними в игру «Сочини стишок», чтоб развивать у них языковые навыки.

6. Грамота.ру

Здесь собраны все действующие на данный момент правила русского языка, учебные пособия, онлайн-упражнения для повышения своего уровня грамотности, а на форуме сидят знатоки, у которых можно проконсультироваться в трудной ситуации. Еще тут можно проверить как пишется то или иное слово.

7. Проверка читаемости текста

Этот сервис оценивает читаемость текста по нескольким шкалам (в скобках даны приблизительные пояснения, точные формулы для расчета индексов вы легко найдете сами, если интересно):

  • Индекс удобочитаемости Флеша (рассчитывается по соотношению число слов к числу предложений и числу слогов к числу слов);
  • Индекс Колмана – Лиау (рассчитывается по соотношения числу слов к числу предложений и числу букв к числу слов);
  • Индекс Dale–Chall (учитывает сложность слов);
  • Автоматический индекс удобочитаемости (учитывает соотношение числа букв в тексте к числу слов);
  • Индекс SMOG (учитывает число слов длиннее трех слогов)

В результате выносится вердикт для какой возрастной группы будет понятен проверяемый текст. Опусы IT-журналистов обычно определяются предназначенными для людей 15-16 лет. Это не очень хорошо, так как великолепные тексты проверенных мной русских классиков сайт признает годными для детей 9-11 лет.

8. Поиск повторов слов


Здесь можно проверить соблюдается ли в тексте закон Ципфа. Очень грубо и приблизительно поясню, что это значит.
Для каждого слова в языке рассчитывается его частота употребления. Условно : для предлога «в» она равна 3, для слова «однажды» 1000, а для «васильковый» 10000. Если слово в тексте встречается намного чаще, чем это положено ему по рангу популярности, то наблюдается несоблюдение закона, которое снижает качество восприятия текста.
После проверки текста будет отображен список из 20 самых популярных слов и рекомендации по оптимальному количеству повторов для каждого слова, которое бы соответствовало закону Ципфа.

9. Анализ настроения автора текста

Это забавный сервис с дизайном, хранящим светлую память ранних двухтысячных, который находит в тексте слова, соответсвующие определенным эмоциями и выдает предположения о душевном состоянии того, кто его написал.. Если у кого-то получится позитивный результат, отпишитесь о нем пожалуйста.

10. Сравнение двух текстов

И напоследок сайт, на котором можно найти отличия между двумя текстами. Да, такая возможность есть в большинстве текстовых редакторов, но иногда бывает удобно делать это именно онлайн.

Подробности Создано: 12.04.2014 20:02 Обновлено: 10.03.2019 18:32 Опубликовано: 12.04.2014 20:02

В последнее время многие студенты столкнулись с проблемой о которой хотелось бы сегодня поговорить. Проблема эта связанна с проверкой работ на уникальность в самом распространенном в России сервисе проверки студенческих работ – сайте antiplagiat.ru.

В настоящее время сайт antiplagiat.ru внес ряд дополнений после которых некоторые документы отображаются в системе проверки как «Подозрительный документ». Вроде и процент уникальности может быть высокий, но файл светится красным и возле названия работы отображается восклицательный знак который и сигнализирует по мнению авторов данного новшества преподавателю что с документом что-то не так.

Если нажать на значек "Подозрительный документ" то откроется информация о документе в которой можно увидеть причину того почему сайт распознает документ подозрительным, по факту их четыре:

Причин связанных с этим на самом деле может быть очень много, но разве преподаватель будет заморачиваться и разбираться какая именно у Вас причина появления данного значка.

Вот что нам ответили создатели данного ресурса:

«Появление данного знака говорит о том, что нужно более внимательно отнестись к данному документу. Возможно, были попытки обхода системы. Возможно в тексте присутствует слишком много иностранных слов, либо слов, где превышена средняя длина слова. Такое возможно в работах, где используется много терминов (работы по химии, юриспруденции, например). В отчете ВУЗа есть текстовые статистики, на основе которых и появляется этот знак (индекс читаемости, максимальная длина слова и пр.). Появление данного знака и выделение документа всего лишь дает сигнал преподавателю более внимательно отнестись к данному тексту. Однако не факт, что работа действительно сделана так, чтобы обойти систему. Отбор работ проводится на основании определённых показателей-индикаторов в текстовых статистиках, которые можно увидеть, открыв отчет в ВУЗе. Однако все эти индикаторы не дают точного «приказа» забраковать этот текст. Они просто дают повод преподавателю более внимательно и серьезно отнестись к проверке данной работы. Если преподаватель этого не знает, он может написать нам письмо и мы ему об этом расскажем. Преподаватель не должен ориентироваться только на проценты и появление данного знака, он также должен открывать отчет и просматривать его».

Вот что пишут недовольные данным новшеством люди:

Давайте теперь попытаемся разобраться с чем это может быть связанно и как с этим бороться, как убрать этот «Подозрительный знак» и сделать наш файл обычным.

Чаще всего это бывает из-за того что в тексте встречаются длинные, сложные или иностранные слова, например, "социометриия", "либерализированный", GlobalFinance и прочие, которые не распознает автоматическая проверка орфографии.

Все слова которые ворд подчеркивает красным, типа с ошибкой. Как показывает практика так же это и все слова которые длиннее 10 букв, в общем все очень длинные слова нам и нужно будет менять на синонимы или разделять на 2-3 слова для того чтобы в конце наш текст стал понятным программе проверки и он перестал выделяться «Подозрительным документом».

Итак подведем итог, что нам делать чтобы файл стал нормальным и прошел проверку.

Индекс читабельности

Индекс удобочитаемости - мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.

Индекс удобочитаемости Флеша

Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка. Она оценивает сложность текста по следующей формуле:

Либо:

FRE = 206.835 − (1.015 × ASL) − (84.6 × ASW)

ASL - средняя длина предложения в словах (англ. average sentence length).

ASW - средняя длина слова в слогах (англ. average number of syllables per word)

Индекс по шкале FRES (Flesch Reading Ease Scale) распределяется таким образом:

100: Очень легко читается. Средняя длина предложения составляет 12 или менее слов. Нет слов из более чем двух слогов.

65: простой английский язык. Средняя длина предложения составляет от 15 до 20 слов. В среднем слова имеют 2 слога.

Для английского языка значение 90-100 соответствует лёгкому тексту для младших школьников, 60-70 - тексту, который могут читать выпускники школы, тексты с индексом 0-30 предназначены для людей с высшим образованием.

В связи с тем, что в русском языке средняя длина предложения меньше (за счет меньшего использования служебных слов, таких как артикли или вспомогательные глаголы), а слова в среднем длиннее, было предпринято несколько попыток разработать специфическую для русского языка версию меры, например, путём подгонки коэффициентов при сравнении индексов, полученных для оригинальных английских текстов и их переводов. Ниже представлен один из вариантов такой адаптации.

FRE = 206.835 − (1.3 × ASL) − (60.1 × ASW)

В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.



11. Пропаганда и Public Relations – соотношение терминов.

ПР и пропаганда. Относительно пропаганды существуют два магистральных направления мнений. Согласно первому направлению, пропаганда и ПР практически не отличаются друг от друга: оба понятия означают использование определенных технологий для эффективного внедрения каких-либо тезисов в массовое сознание. Тем не менее большинство ПР-специалистов считают, что называть пропагандой их деятельность неправомерно: пропаганда допускает искажение цифр и фактов в чьих-либо интересах, в то время как ПР основывается на правдивой информации. Пропаганда имеет жесткую установку и стремится заставить людей принять некоторую точку зрения причем не интересуясь, хотят они этого или нет. ПР носят более мелкий характер и лишь предлагают людям воспользоваться некоторой информацией. А затем добровольно принять те или иные мнения и идеи. Пропаганда делает упор на одностороннее воздействие на индивида или группу, ПР в обязательном порядке предполагают налаживание механизма двусторонней связи, получение и учет встречного сигнала со стороны аудитории.



© 2024 plastika-tver.ru -- Медицинский портал - Plastika-tver