|
Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
vmb

Зарегистрирован: 14.02.2010 Сообщения: 390
|
Добавлено: Сб Мар 13, 2010 6:41 pm Заголовок сообщения: Статистика текста |
|
|
[Текст устарел, поэтому удалён. Описание новой версии здесь.]
Последний раз редактировалось: vmb (Чт Апр 29, 2010 9:12 pm), всего редактировалось 8 раз(а) |
|
Вернуться к началу |
|
 |
vmb

Зарегистрирован: 14.02.2010 Сообщения: 390
|
Добавлено: Вс Мар 14, 2010 1:51 pm Заголовок сообщения: |
|
|
Добавлены:
- подсветка зияний и скопления согласных;
- подсветка местоимений и глаголов-связок;
- список слов, отсортированных по длине.
Звукосочетания из таблицы переместились в текстовый блок, для наглядности.
Описание в шапке обновлено. |
|
Вернуться к началу |
|
 |
Ирма

Зарегистрирован: 20.01.2008 Сообщения: 1578
|
Добавлено: Вс Мар 14, 2010 6:00 pm Заголовок сообщения: |
|
|
Забавная штука. Только туда бы помимо "свой" добавить ещё их, её, его и прочие ним, нею и т.д. Себя, меня, мне, мной и пр.
И ещё там, туда, оттуда и т.д., начинающие часто на них спотыкаются - "полез в шкаф и достал оттуда", "посмотрел за окно и увидел там" (то есть понятно, что лучше просто "достал из шкафа" и "увидел за окном", но хотя бы так). Кстати, "так", "такой" и т.д. тоже туда же. И ещё "вот".
Ну если заморачиваться, то можно ещё выделять, например, однокоренные слова, встречающиеся в пределах двух десятков слов друг от друга - программа потянет? А то много чего можно вспомнить при случае .
Два и более инфинитива подряд, например, потянет? (Только там придётся отсекать слова типа "жесть", "снасть" и т.д.) А если не подряд, а через слово? И одинаковые предлоги в пределах трёх-четырёх-пяти слов друг от друга (отслеживать фразы типа "шёл дождь и два студента, один в пальто, другой в университет, один по тротуару, другой по поручению, один под зонтиком, другой под надзором полиции. Они зашли в кафе, и один пил чай с сахаром, а другой с удовольствием").
Да, и окончания "ся" и "сь" выделять бы, но чтобы оно не помечалось в середине слов типа "всякий" или "лисье" и не путалось со словами типа "весь" или "Вася".
И если наберётся много критериев, могут понадобиться разные цвета заливки для разных выборок, чтоб не путаться, - это реально?
Вы, похоже, влипли в долгосрочный проект . |
|
Вернуться к началу |
|
 |
vmb

Зарегистрирован: 14.02.2010 Сообщения: 390
|
Добавлено: Вс Мар 14, 2010 6:17 pm Заголовок сообщения: |
|
|
Ирма
Конечно, там многое нужно бы добавить, просто это была поделка на коленке, даже не знаю пока, буду ли развивать.
Тут ведь есть и другая опасность: если добавить очень много всего, выйдет путаница, машина ведь не станет объяснять своих действий, она не редактор. Нужно будет под каждый критерий выделять отдельный экземпляр текста, потому что цветовой винегрет тоже не всегда удобно читать.
Может быть, в будущем добавится возможность самому пользователю определять «группу риска», перечислением словоформ или регулярными выражениями.
Ещё можно случайные рифмы искать, но это тоже непросто формализировать, а подключать базу ударений -- выйдет монстр, который в один файл не уместить (сейчас всё в одной страничке, можно просто сохранить и пользоваться локально).
Это никогда не станет академическим проектом, у меня нет достаточных знаний, ни филологических, ни программистских. Да и подход должен быть другой: с выделенным сервером, с базами данных, писать нужно на языках, исполняемых на сервере, а не в браузере, а я таким никогда не занимался.
Скорее всего, это такой однодневный проект для Science Fair :)
Хотя по себе знаю: напишешь такую ерунду для развлечения, а потом теряешь сон и аппетит, надстраиваешь этаж за этажом. Но я буду бороться, авось эта русалка меня не утащит. Хотя, понимаю, многим хотелось бы, чтобы утащила)) |
|
Вернуться к началу |
|
 |
fluffy
Зарегистрирован: 14.04.2009 Сообщения: 53
|
Добавлено: Вт Мар 16, 2010 5:03 am Заголовок сообщения: |
|
|
отлично! прямо на собственном конкурсном отрывке и проверила. работает эта ваша программка, что я могу сказать! 6 "был/а/о/и", 6 "но" и 23 "и"! мама дорогая! списать на стилизацию деской речи не получится.
очень полезно для самокритики, да! а можете туда еще всякого побольше, а? частотность шипящих, например... еще хорошо бы проверку на неблагозвучность на стыке слов, цепочки родительных падежей, расщепленные сказуемые (но это я совсем себе технически не представляю) или прилагательные подряд? или я совсем размечталась? |
|
Вернуться к началу |
|
 |
vmb

Зарегистрирован: 14.02.2010 Сообщения: 390
|
Добавлено: Вт Мар 16, 2010 8:54 am Заголовок сообщения: |
|
|
fluffy
Ну, как раз «и», мне кажется, там к месту, в таком количестве. В оригинале сплошной полисиндетон (можете прогнать английский текст через статистику), эдакий бытовой эпос получается, вроде «Слова о полку Игореве» :)
Я, может, буду по чуть-чуть добавлять, ещё не знаю. На всякий случай, можно писать всякие идеи, не исключено, что какие-то пойдут в дело) |
|
Вернуться к началу |
|
 |
nadine
Зарегистрирован: 11.05.2009 Сообщения: 78
|
Добавлено: Вт Мар 16, 2010 5:03 pm Заголовок сообщения: |
|
|
vmb, спасибо, какая штука хорошая )) |
|
Вернуться к началу |
|
 |
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах Вы не можете добавлять приложения в этом форуме Вы можете скачивать файлы в этом форуме
|
|