Chess Video Plus, E-rating, F-rating etc ...

User info

Welcome, Guest! Please login or register.


You are here » Chess Video Plus, E-rating, F-rating etc ... » Империя кривых зеркал » Рейтинги - Вопросы и ответы.


Рейтинги - Вопросы и ответы.

Posts 151 to 178 of 178

151

Magin wrote:

ГИПОТЕЗЫ написал(а):
Они равно МОЩНЫ эти гипотезы поэтому надо использовать ДВА рейтинга СИЛЫ и СЛАБОСТИ
Есть понятия, которые связаны между собой обратным соотношением. Если тело А тяжелее тела Б в 2 раза, то тело Б не может быть легче тела А в 3 раза. Независимо от единиц измерения. Или же надо давать какое-то другое определение понятиям тяжесть/легкость.

Так же и с рейтингами.

Нет не также. В данном случае вы обрабатываете один и тот же массив данных двумя разными НО ЭКВИВАЛЕНТНЫМИ методами. Один раз с точки зоения ПОБЕД. Другой раз с точки зрения ПОРАЖЕНИЙ.

Если игрок А сильнее игрока Б в 2 раза, то не может игрок Б быть слабее А в 4 раза.

Да если Вы имеете дело с матчем. В матче происходит вырождение и Сила А / Сила Б = Слабость Б / Слабость А

Для матрицы это не действует и соотношение СИЛ не равно обратному соотношению СЛАБОСТЕЙ, поскольку они получены В РАЗНЫХ ГИПОТЕЗАХ
===========================

Рассмотрим круговик.  СТОП Это уже другой вопрос. Я его знаю и много раз обсуждал. Но надо завершить первое обсуждение.

100 участников, игрок А набирает 98 очков, игрок Б - 97. Игроки примерно равны по силе или нет? Для меня - да. В грубом приближении игрок А сильнее игрока Б в 98/97 раза.

Здесь вы привлекаете ТРЕТЬЕГО игрока, подменяете ситуацию. Перескакиваете от относительных очков к абсолютным. Если вы аккуратно распишете матрицу на троих игроеов, то полагаю все сойдется :)

Теперь рассмотрим "равномощную гипотезу". Нам говорят - не менее важно, что один проиграл одну, а второй - целых две партии. Поэтому "по слабости" игрок Б слабее игрока А в 2 раза. И для получения "объективного рейтинга" надо сложить 98/97 и 2.

Чушь? На мой взгляд, да. Для меня игроки, которые слабее А в два раза, должны набрать где-то очков 50, но никак не под сотню. То есть очевидно, что шкалы измерений "равномощных гипотез" абсолютно разные, причем нелинейные,- их ни складывать, ни вычитать смысла не имеет.

Прочтите посты выше, там говорится об усреднении вероятностей. Очевидно что это в принципе надо делать с ВЕСАМИ, с достоверностью.

Заодно рассмотрим еще один интересный случай. Также игрок А набрал 98 очков, Б - 97, но при этом Б не проиграл ни одной партии,- противники не являлись. Кто сильнее - А или Б?

Я заранее не могу сказать. Но достоинство математики в том, что она в таких вопросах разбирается лучше нас.

Для собственного рейтинга результаты 0:0 и 1/2:1/2 - это не одно и то же. Поэтому в вопросе, кого считать сильнее по итогам такого турнира, я доверюсь собственному рейтингу - нет другого более объективного критерия.

Не понял о каком собственном рейтинге идет речь

Результат 0-0 не имеет стат веса. результат 5-5 более весом. Еще более весом результат 100 - 100. Понятно что надо исследовать дисперсии и тд и тп. Но это уже совсем далекий вопрос. А в рамках соотношения сил в пределаз 75% - 25% вполне можно обойтись без дисперсий ...

0

152

Magin wrote:

...Я лишь показал, что для таких ситуаций достаточно одного "рейтинга силы" (Е+).

Мне конечно не след вмешиваться ... Ну ладно. Последний раз. :)
Ничего Вы не показали. Два абсолютно РАВНОПРАВНЫХ метода приводят к разным ранжированиям. Всякий логически мыслящий человек скажет, что раз они РАЗЛИЧНЫ значит их надо учитывать ОБА и мы не имеем никакого права откидывать один из них, если конечно не желаем надурить окружающих. В частном случае МАТЧА Е+ и Е- АБСОЛЮТНО ИДЕНТИЧНЫ (ТОЖДЕСТВЕННЫ)

0

153

Vladimirovich:
Рейтинги учитывающие всю предысторию, всегда будут точнее, чем рейтинги по результатам данного турнира.
Magin:
Да, конечно.

===========
:D  :D

Ну вы блин даете ... !!!

НЕТ КОНЕЧНО

Если говорить о рейтингах как об ОЦЕНКЕ прошлого, то это абсолютно неверный подход. Каждый рейтинг на массиве данных бутет СТРОГО соответствовать именно этому массиву и никаких точнее или не точнее. Ну допустим в матче вы решили делить призовой фонд пропорционально Е+ рейтингу. Если игроки сыграли 10 партий 6-4 то один получит 60% второй 40. Если они сыграли 100 партий 62.5 на 37.5 то первый получит 62.5% второй 37.5% Значит ли это, что во втором случае "ТОЧНЕЕ"? :D :D

Если же говорить о рейтингах как об инструменте прогнозирования, то там столько факторов влияющих на результат, что надо говорить о динамичных рейтингах с немонотонной зависимостью от времени (Эло - монотонная функция) А если пренебречь динамикой то мы получим что результаты 6-и летнего Каспарава помогают уточнить прогноз !!! Так что ли? :D

Однако извините. Больше не буду ... :)

0

154

Magin wrote:

Vladimirovich написал(а):
И методы технического анализа финансовых рынков это используют.
Да, я тоже хотел их привести в пример. На этих рынках в иллюзиях долго пребывать не получится - за каждый неверный прогноз приходится платить. Поэтому там ес-но используют и усреднение историчности курсов (=рейтингов) с разными периодами, и учет веса результатов (экспоненциальное усреднение) и пр.

Vladimirovich написал(а):
И, что характерно - е-рейтинг они не используют , нееет
Там сразу не разберешься, как его применить. Но я все равно думаю, как бы с ним влезть,- штука-то полезная .

Достоинство собственного рейтинга - усреднение шумов по результатам попарных сравнений. Вот шахматистов можно только дискретно сравнивать (то есть большая погрешность сравнения, наличие случайных результатов), но с-рейтинг позволяет все это в итоге усреднить и выдать максимально объективную оценку. По мне так это маленькое чудо .

Отредактировано Magin (Сегодня 01:34:40)

1
Ну и шахматистов можно сравнивать "непрерывно" введя понятие "качество победы" Оценивать должны специалисты на основании наверное компьютерных оценок. Павда нужно еще договориться "что лучше" т.е. построить табель о рангах побед и поражений.
А там вообще море и фимлософии и психологии... Скажем победа Крамника над Пономоревым в длинющем эндшпиле по таблицам Налимова должна быть оценена ОЧЕНЬ ВЫСОКО не из-за длинны партии, а из-за того что надо было продемонстрировать высокую технику, понимание позиции и тд ...
Победа же в компа в матче Комп - Крамник матом в один ход могла бы иметь минимальную оценку победы ... Но возможно оценка поражения для Крамника должна быть и повыше. Вот тут и сказывается различие Е+ и Е- рейтингов. И кстати сам принцип - Победа для одного - НЕ РАВНА поражению для другого. То есть с точки зрения Е+ за то что А выиграл у Б платит не только Б, но и все остальные.
С точки зрения Е- рейтинга за поражение А от Б получает не только Б но и все остальные. Но платят и получают по разным  законам

2. О случайности. При небольшой статистике (один - два периода) можно интерпретировать различие между парным рейтингом и общим рейтингом как случайность. Однако если обрабатывать большой массив например блиц партии на ICC то там различие можно объяснять закономерностью.\

Например Ra = 5000 Rb = 4000 Но Wa/Wb = 1 значит что B неудобный соперник для A

0

155

156

Magin wrote:

Пока потенциалы графов находятся на "вылежке", есть время снова поразмышлять о расчете рейтинга шахматистов.
В постах выше мы разошлись с ув. Е-not-ом о правильности усреднения Е-рейтинга сложением "рейтинга силы Е+" и "рейтинга слабости Е-" (в терминах потенциалов - среднее потенциалов прямой и транспонированной (все стрелки графа в другую сторону) матрицы). Я и сейчас остаюсь при своем мнении, что данная операция "усреднения" не выглядит математически обоснованной.
Но мы можем попытаться включить "учет слабости" в саму модель на начальном этапе (а не на конечном). Поясню, о чем идет речь.
В простой линейной формуле, которая используется для расчета динамического рейтинга (основа для Е+)
dR1 = k*(w12 R2 - w21 R1)   (1)
меня устраивает логика расчета прибавочного рейтинга для победившей стороны. Чем более сильного соперника мы победили - тем больше прирост нашего рейтинга (поскольку прирост - это доля), победили слабого - прирост меньше.
Но вот с точки зрения проигравшего действительно могут возникнуть вопросы. Почему размер потери рейтинга при проигрыше не зависит от того, кому мы проиграли?
Более справедливой выглядит логика, при которой если мы проиграли сильному, то потеря в рейтинге меньше, чем в случае проигрыша слабому.
Насколько я понял, именно такую логику имел ввиду ув. E-not при критике одностороннего Е+ в постах выше.
При таком подходе формула расчета динамического рейтинга становится нелинейной. Мы ставим прирост рейтинга в зависимость от отношения рейтинга играющих:
dR1 = k*(w12 R2/R1 - w21 R1/R2)   (2)
dR2 = k*(w21 R1/R2 - w12 R2/R1)   (2')
Принцип баланса в такой системе сохраняется: dR1 + dR2 = 0.   (3)
При выигрыше первого участника (w12=1, w21=0) получаем следующие приросты:
dR1 = k R2/R1, dR2 = -k R2/R1.   (4)
То есть чем больше разница в рейтингах тем больше прирост при выигрыше и потеря при проигрыше. В такой модели сильный игрок, имеющий маленький рейтинг, быстрее нагонит "старших по рейтингу". И наоборот, потери сильного от проигрыша слабым будут довольно чувствительными.
В случае ничьей формула (2) дает такой прирост:
dR1 = k/2*(R2^2 - R1^2) / (R1 R2)    (5)
Откуда мы видим, что положительный прирост будет у того участника, чей начальный рейтинг меньше, что вполне логично. Отличие от (1) - в нелинейности (квадратичности).
В чем еще преимущество формулы (2)? В том, что теперь коэффициенту релаксации k можно дать определенный смысл - это количество прироста рейтинга при победе участника над равным ему по рейтингу (если R2=R1, то dR1=k).
Теперь мы можем составить уравнение (систему уравнений) для расчета стационарного рейтинга, использующего в качестве основы формулу (2) (надо бы дать данному рейтингу отдельное название - предложения принимаются).
Принцип тот же, что и при определении Е-рейтинга - мы определяем для заданного турнира, какой рейтинг участников будет соответствовать тому, чтобы результаты турнира его (рейтинг) не изменили:
dRi = 0   (6)
Для R1 уравнение имеет такой вид:
(w12 R2 + w13 R3 + ...)/R1 = R1 (w21/R2 + w31/R3 + ...)   (7)
и т.д. для всех Ri.
Решая данную систему уравнений (нелинейную), мы получим рейтинги участников с учетом слабости и силы одновременно - тут нам ничего усреднять уже не понадобится.
Насколько будут отличаться результаты по данной нелинейной модели (E2-рейтинг?) от уже привычного Е+ (или Е усредненного), ничего сказать пока не могу - нужно моделировать. Можно попытаться обсчитать по предложенной схеме начинающийся турнир в Вейке.

0

157

Попытка уйти от "двух ипостасей" одного и того же участника в построении ранжирования - очень интересна.  Другой вопрос, что это проблема "квадратуры круга" Мы как бы пытаемся квадрат упаковать в круг. В итоге мы получаем систему НЕЛИНЕЙНЫХ уравнений.
С одной стороны создание однозначной связи с рангами - это хорошо, с другой стороны интерпретация "на пальцАх" трудная.
Я вообще-то не расписал еще и для трех участников Е+ или Е- рейтинг. Ведь дам сразу же начинают "играть" не только числа побед и поражений, но и число партий ... Так шта ...

Что касается
В постах выше мы разошлись с ув. Е-not-ом о правильности усреднения Е-рейтинга сложением "рейтинга силы Е+" и "рейтинга слабости Е-"

то здесь я ни с кем не расходился, поскольку не предлагал никогда "усреднение рейтингов"

Реч шла об усреднении ВЕРОЯТНОСТЕЙ, поскольку имея две разные ипостаси одного и того же участника и две РАВНОПРАВНЫЕ но РАЗЛИЧНЫЕ вероятности вполне уместно их просто усреднить. Но это вовсе не усреднение Е-рейтинга силы и слабости

Операция вычитания - это просто один из простейших алгоритмов сведения двух ранговых линеек к одной (Экономическая модель) Можно взять отношение или другую функцию двух разнонаправленных показателей сводящих их к одному...

0

158

Crest wrote:

Тема поднята очень глобальная.

Местами даже слишком. Скажем, коротким пунктом на две строчки из ста предлагается видоизменить систему рейтинга, учесть временной фактор и т.д. Это отдельная и очень интересная тема. У нас на форуме была где-то пара тем с подробным обсуждением. Лично я согласен с тем, что временной фактор нужно учитывать. Но ни в коем случае нельзя тупо копировать системы других видов спорта. У нас времечко должно учитываться плавным падением рейтинга. Ибо шахматист даже не играя годы, сохраняет весьма приличный уровень.
.

И хотя я тут приболел и ведрами пью чай с медом (увы от инфекции ОРЗ на закрытии МО) никто не застрахован даже пробегая по морозу 13 км 457 м ...

И с остальной частью поста Cresta согласен на 101.3 % Но вот здесь зразу же хочу поправить, ибо это настолько фундаментальное заблуждение, что оно свойственно всем рейтинговым системам ... А вернее свойственно пониманию всех спортивных администраторов, упаравленцев и тд и тп.

1. Основная причина заблуждения в том что смешиваются ДВА совершенно разных понятия. ...

Продолжу здесь, поскольку не всем это интересно, да и не хочется вставать на пути теории жизни :) Мы же не Vladimirovichi ... :D

Про возможные пути решения в рамках модели шахматного сообщества

Итак, почему нельзя их смешивать? Потому что это НЕЗАВИСИМЫЕ величины
Если Иванов сыграл с Петровым 6-4, а Сидоров с тем же Петровым 60 - 40 то СИЛА Иванова и Петрова - равна. Хотя в первом случае она будет 600 + - 50 а во втором 600 +- 5 ... Ошибка в определении силы изменяется от числа сыгранных партий.

Теперь про модель шахматного сообщества.

1. Шахматное сообщество живет за счет ресурсов извлекаемых из ЧЕЛОВЕЧЕСТВА, взамен предоставляя ему различные зрелищьно-досуговые услуги.
Объем ресурсов зависит в тои числе и от раскрученность шахматной элиты.

2. Раскрученность шахматной элиты (в самом широком смысле, например от 1-го разряда и выше) есть продукт ИНДИВИДУУМА и ШАХМАТНОГО СООБЩЕСТВА.

3. Член шахматного сообщества в добровольном порядке принимает на себя определенные обязанности, которые заключаются в активной шахматной деятельности.

4. Поощрение и наказание за шахматную активность осушествляется в виде мягеого (относительного) алгоритма смысл которого в некотором перераспределении призовых (стартовых)

5. Естественно сам алгоритм надо тщательно настраивать, однако его функционирование принципиально такое.

Устанавливается определенная норма активности членов сообщества. Например 50 партий в год.
Шахматист сыгравший например 100% получает скажем 25% надбавки к заработанным призовым из ПРИЗОВОГО ФОНДА ФИДЕ.
Шахматист сыгравший 25 партий - отчисляет в ПРИЗОВОЙ ФОНД ФИДЕ скажем 25% призовых

ПРИЗОВОЙ ФОНД ФИДЕ действует на принципе 100% самоокупаемости

6. В шахматную деятельность могут быть включены и сеансы, и блиц турниры. Одним словом все что популяризирует шахматы как ВИД СПОРТА

7. Почему неакимвный шахматист ДОЛЖЕН вклвдывать в ПРИЗОВОЙ ФОНД ФИДЕ. Да потому что РАЗМЕР ПРИЗОВЫХ - растет с популярностью вида спорта. Таким образом и участники школьных турниров РАБОТАЮТ на элиту.

0

159

Крыс wrote:

1 Взглянув же, Он увидел богатых, клавших дары свои в сокровищницу;
2 увидел также и бедную вдову, положившую туда две лепты,
3 и сказал: истинно говорю вам, что эта бедная вдова больше всех положила;
4 ибо все те от избытка своего положили в дар Богу, а она от скудости своей положила все пропитание свое, какое имела.

А вот вам и древнейшее подтверждение необходимости перехода от абсолютных очков к относительным!!  (е-рейтингу)
http://forumupload.ru/uploads/0005/0c/42/27925-1.gif

Ибо проклят будет всякий кто не прислушается к голосу Отца нашего! http://forumupload.ru/uploads/0005/0c/42/27925-2.gif

0

160

161

162

Vladimirovich wrote:

Была старая тема на КС Инфляция и рейтинг
http://kasparovchess.crestbook.com/view … hp?id=3553
но она уехала под грудой шахматных матчей аж на 17 страницу.
Закопирую сюда на всякий случай, хотя часть уже и устарела, например, п.2 уже неактуален, как мне указали.
Рейтинг считается по каждой партии отдельно.
Прежде всего я хотел бы подчеркнуть, что ни в коем случае не претендую на абсолютную истину и окончательный диагноз предполагаемой инфляции рейтингов.
Безусловно, выводы подобного рода должны основываться на глобальных статистических материалах, коими, безусловно обладает Е-нот, и исследованиях.
Я же лишь хотел остановиться на факторах, которые определенно должны быть приняты во внимание при анализе этой проблемы.
Во-первых, это не чистая математика, как было сказано.
Правильнее сказать было бы, что это чистая статистика. Существуют одновременно и инфляционные и дефляционные факторы. И что доминирует в данный момент, можно сказать только на базе проведения упомянутых глобальных исследований.
Во-вторых, я полагаю, перед тем как обсуждать проблему, нужно договориться, что такое глобальная инфляция рейтинга. Стоит ли ее измерять по топ-10, топ-100, всему миру и т.д. Результаты могут быть разными.
Я скажу только о факторах, которые могут привести к легко определяемой локальной инфляции, т.е увеличение суммарного рейтинга участников турнира.
Причем это только статистика. Никакие сознательные манипуляции с рейтингом не учитываются здесь.
"Увеличение числа имеющих рейтинг" это не вся правда.
1. Люди с коэффициентом 25. Такой кэф дается на первые 30 партий.
Если человек показывает успехи, то его рейтинг резко растет, а его противники теряют рейтинг по меньшему кэф =10-15
2. Функция рейтинга (% очков от разницы) линейна в небольшом интервале
Ну скажем условно 0-100.
Далее разброс рейтингов может приводить к нелинейным эффектам.
Представим гротескный случай. Шахматист с 2600 играет в турнире перворазрядников по 1800. Грубая прикидка ( я попробовал на калькуляторе ФИДЕ) показывает, суммарный рейтинг такого турнира по завершению растет.
Увеличение рейтинга гросса на его норму практически не меняет ( и так ~100%) а вот низам норму снижает по-прежнему неплохо.
Конечно обратный случай - 1800 в турнире гроссов - фактор дефляционный, но так же не бывает
Разумеется в реале это не так заметно. Разница меньше. Но принцип остается.
3. Старый фактор - меньше 2200 не давали. Один из мощнейших ранее инфляционных факторов. Человек получал рейтинг часто, только прыгнув фактически выше головы. Иногда так пунктов на 200. Потом этот рейтинг заслуженно и честно сливался.
Краткое резюме.
Инфляция резко упала (исключительно по личным ощущениям) когда ФИДЕ стало давать рейтинг 1800 и ниже. ( пункты 2 и 3). Пункт 1 пока жив.
Раньше любитель, сыграв в швейцарке с соперниками своего уровне и получив в первом туре гросса ( тому на пропитание), в среднем рос.
Сейчас наоборот люди получают рейтинг 1800 часто заниженный и мы имеем обратную картину.
Как это отражается глобально - надо считать, как уже было сказано.
Я не уверен, что сейчас инфляция есть.

0

163

Сделал (делаю) презентацию о проблемах ранжирования

http://rsport.netorn.ru/uenota/reportch … /frame.htm

0

164

Попробую простыми словами рассказать про е-рейтинг.

Первое упрощающее предположение

Мы считаем, что сила (уровень игры, мастерство) участников на протяжении всего турнира не изменяется. Каждая последующая партия является уточняющим измерением силы данного участника.

Далее будем считать, что каждая победа повышает оценку силы данного участника. Принципиальный вопрос насколько?

Мы не знаем точно, но предполагаем, что такое увеличение просто пропорционально силе побежденного соперника.

Сумма всех таких приращений в ходе турнира дает нам общее увеличение оценки силы участника.

Пусть Галкин в турнире победил малкина палкина и чалкина

Тогда увеличение оценки его силы будес составлять

Увеличение оценки = К * (Сила М + Сила П + Сила Ч)

С другой стороны каждое поражение снижает оценку силы данного участника. Другими словами его соперники забирают некую величину пропорциональную силе данного участника

Уменьшение оценки при одном поражении составит К * Сила Г

Пусть галкин в турнире проиграл Залкинду, а также Иванову, Петрову и Сидорову, то есть четыре партии

Тогда

Уменьшение оценки при N поражениях составит

Уменьшение оценки = N * K * Сила Г

Но согласно нашему основному предположению о постоянстве силы участника мы должны приравнять увеличение и уменьшение оценки силы

N * K * Сила Г = К * (Сила М + Сила П + Сила Ч)

Константа К справа и слева одинакова и она сокращается и в итоге мы получим
уравнение, в котором сила данного участника выражается через силу остальных в зависимости от результатов партий

Сила Г = (Сила М + Сила П + Сила Ч)/N

Теперь для определенности мы должны ввести Эзакрепляющую" нормировку

Например положим что сумма всех сил есть некая константа

Сумма сил = Конст

Или принять за константу силу одного из участников

Таким образом мы получим силтему N уравнений с N неизвестными, которую можно решить на любом коипьютере где стоит Excel

0

165

Не все так просто

Из недавно опубликованного интервью Сергея Карякина.

Юрий Васильев (Спорт-Экспресс)

- Помню, однажды, когда Топалов и Каспаров на турнире в Амстердаме поделили 1-е место, Веселин, у которого были лучшие дополнительные показатели, сказал мне: "Призовые с Гарри мы разделили пополам, а в итоговом протоколе моя фамилия будет стоять выше". На турнире в Базне вы набрали столько же очков, сколько и Карлсен, но в итоге у Магнуса оказался на 0,25 лучше коэффициент Бергера, и его назвали победителем, а вас объявили вторым. Хотя бы приз разделили пополам?!

Сергей Карякин

- Разница между призами символическая, но не в этом суть. Я вообще считаю, что в круговых турнирах дополнительные показатели - дело неблагородное. Если два человека набрали одинаковое количество очков, то оба должны быть победителями, как, например, это практически всегда делалось в Вейк-ан-Зее. Я высказывал это мнение и после Мемориала Таля, где коэффициент был ко мне более благосклонен, так что меня трудно обвинить в предвзятости. Ну, а если уж обязательно нужен один победитель, как это было, например, в Суперфинале чемпионата России, то тогда надо играть тай-брейк.

==============================================================

Недовольство общепринятой системой ранжирования, основанной на абсолютных очках стало постепенно проникать и в головы шахматной элиты. Однако, сооображений о необходимости сменить "идола" всего современного спорта пока нет. Пока продолжаются поиски способов ремонта. Как подкрасить, подретушировать "его величество абсолютное очео". Предложениям типа "А вот у футболистов... А вот у теннисистов ... несть числа.

Это мне напоминает времена перестройки. Да Сталин - злодей, но Ленина - не трожьте ...

Вот казалось бы очевидное. "Если два человека набрали одинаковое количество очков, то оба должны быть победителями, как, например, это практически всегда делалось в Вейк-ан-Зее."

Но в круговом турнире существует внутреннее противоречие, о котором в общем-то все знают, но принимают как неизбежное зло. Дело в том что даже в круговике (о швейцарках и нокаутах уж и не говорю) мы имеем дело с решением проблемы ранжирования участников выполняющих РАЗНЫЕ задание. Ну как бы если в забеге на 100 м одни бегут 97 м другие 102 третьи - 100 м. Но надо определить победителя.

Ведь в круговике у Иванова и Петрова один и тот-же набор соперников (возможность разных цвета пока опустим) но они еще встречаются между собой! Иванов никогда не играет с Ивановым, а Петров с Петровым.

Многим покажется что это какая-то казуистика. Но математика требует решить этот вопрос принципиально. В круговике вы имеете ДВА типа определения лучшего (сильнейшего) - измерение (результаты с другими участниками) и противоборство (результаты партии между собой)

Вот представьте себе ситуацию: Иванов постоянно выигрывает у всех кроме Петрова, а Петров - всем проигрывает, но всегда выигрывает у Иванова.

Так кто же из них лучше играет в шахматы?

(Продолжу позже)
Блог пользователя - ЕвгенийПотемкин Добавить комментарий

0

166

25 августа 1903 года родился Арпад Эло, автор рейтинговой системы ЭЛО







Будущий создатель рейтинговой системы, которая используется в современных шахматах, родился в Венгрии, в местечке Эдьхазашкесе близ города Папа. В 1913-м он вместе с родителями эмигрировал в США. В этой стране Арпад Эло прожил все жизнь.

Он не был профессиональным шахматистом: после школы поступил в Чикагский университет, по окончании которого в 1935 году стал профессором физики и астрономии Маркеттского католического университета. Профессиональный ученый, Эло был неплохим игроком, национальным мастером. Он  8 раз становился чемпионом штата Висконсин, дважды играл вничью  с Робертом Файном и даже играл в чемпионате США с 14-летним Робертом Фишером.  Начиная с 1935 года, он работал на разных должностях в Американской шахматной Федерации, затем – в ФИДЕ.
Всемирную известность Арпаду Эло принесла разработанная им система индивидуальных рейтингов шахматистов. В 1959 году по просьбе тогдашнего президента Шахматной федерации США Джерри Спэнна (Jerry Spann) профессор Эло вошел в состав комиссии по пересмотру и усовершенствованию системы индивидуальных коэффициентов, применявшейся в федерации для оценки относительной силы игроков. Эта система страдала рядом существенных недостатков: в частности, позволяла шахматисту, проигравшему все партии турнира, повысить свой рейтинг, и наоборот. Идеи Арпада Эло были положены в основу новой, статистически более корректной системы, основанной на расчете ожидаемого результата в зависимости от относительной силы участников соревнований.
Система Эло была принята Шахматной федерацией США в 1960 году, а Международной федерацией шахмат (ФИДЕ) - в 1970 году. Система была достаточно проста, чтобы проводить подсчеты без вычислительной техники. Поначалу Арпад Эло  лично подсчитывал рейтинги всех шахматистов: в течение 15 лет Эло возглавлял Квалификационную комиссию ФИДЕ. Система профессора ЭЛО с небольшими модификациями используется ФИДЕ по сей день.
Сам Эло призывал не придавать созданной им системе универсального значения. "Часто люди, не слишком хорошо знакомые с природой и ограничениями статистических методов, ждут от рейтингов слишком многого. Рейтинги обеспечивают лишь сравнение успехов, не больше и не меньше… Определение рейтинга каждого отдельного шахматиста можно сравнить с определением положения покачивающегося на волнах поплавка, привязанного к удочке леской, колышущейся на ветру", - писал он в 1962 году в статье для журнала Chess Life.
В 1988 году профессор Арпад Эло был введен в Зал славы шахматной федерации США. Скончался Эло 5 ноября 1992 года в штате Висконсин

0

167

E-not wrote:

Мы считаем, что сила (уровень игры, мастерство) участников на протяжении всего турнира не изменяется. Каждая последующая партия является уточняющим измерением силы данного участника.

Думается, что это самое спорное допущение итерационных рейтингов, рассчитывающих разом весь массив игр без учета их последовательности. Всё же сила участников на протяжении турнира зачастую меняется. Если брать командные виды спорта, то, к примеру, "Анжи" с Жирковым и Это'О и "Анжи" без Жиркова и Это'О - практически две разные команды. В личных видах спорта участники также подвержены факторам, влияющим на силу игры (устал, не выспался, заболел, опустил руки из-за плохих результатов, или же, напротив, окрылён удачными выступлениями).

Именно поэтому сложно принять, что вероятность вашей победы над "Анжи" в первом туре чемпионата России по футболу зависела от того, выиграет ли уже "совсем другой" "Анжи" в туре 23-м у кого-то, с кем вы играли в туре 15-м.

0

168

Уважаемый E-Not!

Никак не пойму, почему вот в этой таблице:
http://rsport.netorn.ru/blitz/280509.htm
у участника Cambat, проигравшего все встречи, имеется E+, да ещё и столь высокий?

0

169

Аааа, понятно. Дело в том, что при обсчете этой таблицы была использована "спортивная система" 3/1, а не 1-0. Это означает, что победа в партии рассматривалась как преимущество в лжин спортивный разряд. Ну или так. Вы выиграли партию у соперника и алгоритм считает что в последующих 100 партиях вы возьмете 75 абсолютных лчков или 75% В этом случае, даже проиграв все партии вы имеете 25% очков ... То есть сам факт включения в турнир уже означает какую то положительную оценку.
Если же использовать жесткуо систему - "гамбурский счет", - то естественно Е+ будет 0. Алгоритм как бы предполагает, что проигравший вообще не умеет играть. Подбор соотношения цены победы и поражения можно в принципе заложить в условия турнира. Однако при достаточно большой статистике ранжирование в любой системе совпадают... Ранжирование просто по абсолютным очкам примерно соответствует системе 10001 / 9999/ Когда-то это обсуждалось в Интернете .

0

170

Red_front wrote:

Думается, что это самое спорное допущение итерационных рейтингов

Если Вы говорите о Е-рейтинге, то он не является итерационной системой! Это просто ПЕРЕСЧЕТ на основе новой матрицы. Е-рейтинг N-го тура НЕ определяется Е-рейтингом N-1 тура

Что же касается постоянства силы в данном турнире, то 1. это необходимое условие ранжирования. 2 - абсолютные очки тем более считают не только постоянной силу, но и равной силу всех участников турнира, поскольку за победу над каждым дается 1 очко.

Относительные же очки полагают что например в системе 3/1 сила участников может колебаться от 3 до 1/3 Причем от силы данного соперника ...

0

171

E-not wrote:

Если Вы говорите о Е-рейтинге, то он не является итерационной системой! Это просто ПЕРЕСЧЕТ на основе новой матрицы. Е-рейтинг N-го тура НЕ определяется Е-рейтингом N-1 тура

Извиняюсь, видимо, неточно выразился. Под итерационными я подразумевал рейтинги, пересчитывающие весь массив данных после каждой новой встречи.

Вот и получается, что в первом туре моя команда победила слабый "Анжи", в котором ещё не было Жиркова и Это'О. Затем, в районе 20-го тура, "Анжи" дозаявил этих звездных игроков, после чего сила его игры резко возросла, что, согласно алгоритму расчета, стало влиять и на результат матча, сыгранного нами в первом туре, поскольку пересчитывается весь массив данных.

Вот мне и интересно, не ставит ли это под сомнение одну из аксиом, принятых при составлении алгоритма расчета:

Что же касается постоянства силы в данном турнире, то 1. это необходимое условие ранжирования.

Или же, можно поставить вопрос иначе: применимы ли рейтинги подобного типа (в том числе и Е-рейтинг) в ситуациях, когда наблюдается явный рост (спад) силы игры участника по ходу турнира?

2 - абсолютные очки тем более считают не только постоянной силу, но и равной силу всех участников турнира, поскольку за победу над каждым дается 1 очко.
Относительные же очки полагают что например в системе 3/1 сила участников может колебаться от 3 до 1/3 Причем от силы данного соперника ...

Про абсолютные то очки как раз всё абсолютно понятно. Что же касается относительности, то проблема растущих игроков - основная проблема большинства рейтинговых систем, в том числе и Эло-подобных.

0

172

E-not wrote:

Аааа, понятно. Дело в том, что при обсчете этой таблицы была использована "спортивная система" 3/1, а не 1-0. Это означает, что победа в партии рассматривалась как преимущество в лжин спортивный разряд. Ну или так. Вы выиграли партию у соперника и алгоритм считает что в последующих 100 партиях вы возьмете 75 абсолютных лчков или 75% В этом случае, даже проиграв все партии вы имеете 25% очков ... То есть сам факт включения в турнир уже означает какую то положительную оценку.
Если же использовать жесткуо систему - "гамбурский счет", - то естественно Е+ будет 0. Алгоритм как бы предполагает, что проигравший вообще не умеет играть. Подбор соотношения цены победы и поражения можно в принципе заложить в условия турнира. Однако при достаточно большой статистике ранжирование в любой системе совпадают... Ранжирование просто по абсолютным очкам примерно соответствует системе 10001 / 9999/ Когда-то это обсуждалось в Интернете .

А, ну если 3-1, то тогда всё понятно. А то я всё гадал, как же так получилось.  :)

Кстати, обратил внимание, что при низкой заполненности матрицы, Е-рейтинг практически при любой шкале оценки результата (что 1-0, что 3-1, что 100-99) ""вытягивает" наверх соперников сильнейших команд, даже если они у этих сильнейших не выигрывали, а просто играли вничью.

Как пример, прошлый чемпионат мира по футболу, в котором Е-рейтинг при оценке 1-0.5-0 ранжирует Гондурас на 6-м месте, хотя тот имеет в своем активе всего одну ничью со Швейцарией. Которая, правда, обыграла лидера рейтинга Испанию и стоит в рейтинге 2-й. А на 3-м месте в рейтинге ещё один представитель группы в которой играла Испания - Чили. Это при том, что ни Гондурас ни Швейцария в плэйофф не вышли, а Чили вылетел уже 1/8. При этом, полуфиналистам чемпионата Германии и Уругваю Е-рейтинг отдает лишь 9-ю и 13-ю позиции.

Last edited by Red_front (2011-09-05 13:44:56)

0

173

Red_front wrote:

"вытягивает" наверх соперников сильнейших команд, даже если они у этих сильнейших не выигрывали, а просто играли вничью.

Ну это ЕСТЕСТВЕННО. Если вы сыграли вничью с Бразилией, значит вы РАВНЫ были Бразилии в данном конкретном ИЗМЕРЕНИИ. Каждый матч, это ни что иное как измерение лучше, равны, хуже

0

174

Red_front wrote:

Это при том, что ни Гондурас ни Швейцария

Если в 1/32 вы проиграли чемпиону мира и вылетели, это означает что вы хуже Бразилии, но И ТОЛЬКО ....

0

175

Magin wrote:

Ну и что тут развивать?

1. Спасибо что вернулись, поскольку введение терминов типа лапласиан, собственные вектора, гамильтониан и тд несомненно перекидывает мостик и к математике и, что мне представляется особенно перспективным к физике. Это серьезно. Потому что использование физических моделей, понятий, ассоциаций, позволяет ИМХО более цивилизованно построить модель шахматного (спортивного и не только) сообщества. Более адекватно оценить происходящие процессы. Это конечно же не механицизм, а стремление использовать более совершенные инструменты... В голову приходит какая-нибудь модель электронных оболочек в атоме, которые можно сопоставить с итоговой турнирной таблицей... Кстати на заре создания квантов именно футбольные таблицы использовались при построении модели атома :)

2. С точки зрения математики - ничего и не было :) Все вопросы находятся в области применения, содержательной интерпретации и анализа эффектов существующих реально, но никак не учтенных моделью.

Ну вот например.
А. Изменение УРОВНЯ мастерства на протяжении определенного периода. Е-рейтинг мы можем рассчитывать не только для одного турнира, но и для совокупности. В принципе берем все результаты поервой тысячи - двух и считаем определители матрицы никаких математических проблем. Однако для молодых - например год - большой период. Его УРОВЕНЬ мастерства изменилось. ( Специально использую термин УРОВЕНЬ для е-рейтинга а не СИЛУ, которая уместна для алгоритма ЭЛО)

Б. Еще проблема - мотивация. Концептуально можно представить ИЗМЕРЕННЫЙ (РАССЧИТАННЫЙ) УРОВЕНЬ как, например произведение СОБСТВЕННО УРОВНЯ на МОТИВАЦИЮ. Другими, гуманитарными терминами, это попытка учесть тот факт, что играя в силу обстоятельств во второразрядном турнире, шахматист не мобилизирует все свои возможности. Да и сама система абсолютных очков делает такую мобилизацию бессмысленной, если нет дополнительных стимулов. Недаром американцы учредили приз Фишера за 100%

Кстати различные доп призы хорошо помогают решить многие казусы ранжирования при использовании абсолютных очков. Эти призы как латки и ветхом кафтани прикрывают дыры древней примитивной системы. И вместе с тем естественно убивают интерес к более совершенным алгоритмам. Действительно чего еще придумывать, если и так все хорошо ...

В. Вот еще проблемка - соотношение косвенной и прямой оценки соотношения сил.
Иванов -Петров 30-10
Петров - Сидоров 30-10

Полагая транзитивность (а что еще?) оцениваем Иванов - Сидоров 90 - 10

Реально счет 5 - 5

Как определить соотношение сил? Полагаться только на реальный результат? Или учесть косвенный?

В общем загадок, вопросов множество ... Одна проблема - найти заинтересованное лицо во властных структурах. Ведь шахматные (спортивные) проблемы характерны и для всего социального сообщества. Недаром говорится спорт - модель жизни ... http://forumupload.ru/uploads/0005/0c/42/27925-1.gif

0

176

Владимир Крамник wrote:

"Немножко просто везения не хватило. Мы выступили лучше, чем на прошлой Олимпиаде, выиграли 9 матчей, один сыграли вничью, один проиграли. Обычно такого результата хватает для чистого первого места. Личный матч с Арменией играли на равных, очков у нас поровну, даже личных поровну. Но когда делишь первое место, чтобы раздать медали, используется дополнительный показатель (он складывается из суммы всех очков соперников, умноженной на индивидуальные очки, набранные в матчах друг с другом). Он довольно абсурдный, поскольку зависит не от нас, а от команд, с которыми мы играли. Матч Греция-Италия был важен: если бы Греция сыграла хорошо, мы бы выиграли. А они проиграли, и мы вместе с ними. Обидно, на двух последних Олимпиадах занимать вторые места - причем, что называется, с золотым отливом".

:) Нет уважаемый Владимир Борисович. Он совсем не абсурдный. Все дело в том что вы привыкли к абсолютным мерам. Так вас учили всю шахматную жизнь - 9 очков лучше чем 8. Но это справедливо лишь если соперники одинаковые и выступают одинаково в данном турнире. На олимпиаде же и соперники разные и выступают они по разному. И для того чтобы хоть как-то измерить эту разность и используют этот самый "абсурдный" показатель. Конечно он не идеален. Идеален - е-рейтинг. :), Но это шаг в правильном направлении

0

177

E-not wrote:

Конечно он не идеален. Идеален - е-рейтинг.

Разумеется не идеален, также как и Эло
Рейтинг Эло и Идеальный рейтинг
http://forumupload.ru/uploads/0005/0c/42/27925-1.gif

0

178

Quick post

Write and submit your message



You are here » Chess Video Plus, E-rating, F-rating etc ... » Империя кривых зеркал » Рейтинги - Вопросы и ответы.