?
Лист на сайт
Стрічка новин (RSS)
Посилання сюди	(1)

Текстологія

Микола Жарких

Війна на виснаження Гнило-Солом’яної Орди йде повним ходом. 500 убитих пушкіністів на день уже давно стали нормою, а час від часу повідомляють і про 800 з гаком. А от 5 січня 2023 р. повідомили ще й про 12 знищених артилерійських систем. Чи не наслідок застосування нової системи контрбатарейної боротьби, про яку злегка натякали у пресі?

Для нас цілком недостатньо відкинути ворожу армію за наші кордони. Для нашої безпеки потрібна демілітаризована зона на території Орди. А оскільки дальність польоту їх крилатих ракет досягає 5500 км, то ця зона мусить простягаться на схід принаймні до Якутська (5300 км від Біловодська в Луганській області, а це – теж Україна; 7 січня 2023 р. о 8:40).

Попередній огляд і картографування безспірних назв показав дві дуже суперечні між собою тези:

1, безсумнівно, переліки назв у різних ярликах якось пов’язані між собою;

2, жоден ярлик не повторює перелік з попередніх ярликів, а завжди дає свій варіант.

Тільки три із 82 назв – Київ, Хотмишль та Яголдаєва тьма – присутні у всіх ярликах, решта назв з’являється, зникає і знову з’являється. Можна спробувати застосувати до текстів переліків кластерний аналіз. Я вже пояснював його методику [Жарких М. І. Дві традиції літописання Великого князівства Литовського. – К.: 2016 р., розділ «Аналіз варіантів тексту Повісті про Свитригайла»], тут не повторюю.

Віддалі між текстами будемо рахувати паралельно за двома методиками. Різницю їх показую на прикладі. Нехай в одному переліку стоїть: Київ – Канів – Черкаси, а в другому – Київ – Черкаси – Канів. Жорсткий метод враховує співпадіння назв і їх позицій, тому в нашому прикладі буде два співпадіння. М’який метод ігнорує позиції – аби тільки назви співпадали, і так буде три співпадіння. Ясно, що м’який метод буде давати число співпадінь більше або рівне тому, що дає жорсткий метод.

В наведеній нижче таблиці вище діагоналі стоять стоять співпадіння за м’яким методом, а нижче діагоналі – за жорстким. З неї бачимо, що пара ярликів 1520 – 1532 рр. має по 40 співпадінь обома методами, а пара 1541 – 1542 рр. – 15 м’яких співпадінь і тільки 8 жорстких.

	1461	1472	1507	1513	1514	1517	1520	1532	1539	1541	1542	1552	1560
1461		28	31	25	25	23	23	23	11	25	14	12	11
1472	23		29	31	32	31	29	31	10	29	11	11	10
1507	22	28		45	45	42	37	46	14	41	15	17	16
1513	16	30	45		47	43	42	46	13	40	15	17	16
1514	16	32	45	47		46	41	50	14	43	11	16	15
1517	14	31	42	43	46		39	46	14	45	15	16	16
1520	13	27	37	42	41	39		40	11	36	11	12	13
1532	14	30	44	46	49	45	40		14	42	12	16	14
1539	3	6	10	11	11	11	10	11		14	9	14	14
1541	13	28	31	38	41	42	34	39	13		15	17	15
1542	5	5	7	8	8	7	5	6	6	8		9	8
1552	4	7	12	14	13	13	10	12	14	15	8		21
1560	3	5	9	11	10	10	8	9	11	10	6	19

Тепер число співпадінь (C – coincidence) ми перераховуємо у віддалі між текстами (D – distance) за формулою:

D = 50 / C

Повторюся, що для перерахунку підходить будь-яка спадна функція, так, щоб менше число співпадінь давало більшу відстань.

А число 50? Це – нормувальний множник, поняття, незрозуміле нікому з гуманітаріїв, але добре відоме нам, фізикам-теоретикам (навіть відставним). При такому нормування мінімальна віддаль буде 1 (1514 – 1532 рр. при м’якому рахунку).

Отже віддалі між текстами маємо такі:

	1461	1472	1507	1513	1514	1517	1520	1532	1539	1541	1542	1552	1560
1461		1.79	1.61	2.00	2.00	2.17	2.17	2.17	4.55	2.00	3.57	4.17	4.55
1472	2.17		1.72	1.61	1.56	1.61	1.72	1.61	5.00	1.72	4.55	4.55	5.00
1507	2.27	1.79		1.11	1.11	1.19	1.35	1.09	3.57	1.22	3.33	2.94	3.13
1513	3.13	1.67	1.11		1.06	1.16	1.19	1.09	3.85	1.25	3.33	2.94	3.13
1514	3.13	1.56	1.11	1.06		1.09	1.22	1.00	3.57	1.16	4.55	3.13	3.33
1517	3.57	1.61	1.19	1.16	1.09		1.28	1.09	3.57	1.11	3.33	3.13	3.13
1520	3.85	1.85	1.35	1.19	1.22	1.28		1.25	4.55	1.39	4.55	4.17	3.85
1532	3.57	1.67	1.14	1.09	1.02	1.11	1.25		3.57	1.19	4.17	3.13	3.57
1539	16.67	8.33	5.00	4.55	4.55	4.55	5.00	4.55		3.57	5.56	3.57	3.57
1541	3.85	1.79	1.61	1.32	1.22	1.19	1.47	1.28	3.85		3.33	2.94	3.33
1542	10.00	10.00	7.14	6.25	6.25	7.14	10.00	8.33	8.33	6.25		5.56	6.25
1552	12.5	7.14	4.17	3.57	3.85	3.85	5.00	4.17	3.57	3.33	6.25		2.38
1560	16.67	10.00	5.56	4.55	5.00	5.00	6.25	5.56	4.55	5.00	8.33	2.63

Розглянемо спочатку діаграму на м’яких віддалях. Хід її побудови такий:

База: 1.00 (1514 – 1532);

1513: 1.06 (1513 – 1514) + 1.09 (1513 – 1532);

1517: 1.09 (1517 – 1532) + 1.09 (1514 – 1517);

1507: 1.09 (1507 – 1532) + 1.11 (1507 – 1514); в масштабі креслення позиція 1507 практично співпадає з позицією 1517, тому умовно пересуваємо 1507 вниз і праворуч;

1541: 1.11 (1517 – 1541) + 1.16 (1514 – 1541); в масштабі креслення позиція 1541 практично співпадає з позицією 1532, тому умовно пересуваємо 1541 вниз і праворуч;

1520: 1.19 (1513 – 1520) + 1.22 (1514 – 1520)

1472: 1.56 (1472 – 1514) + 1.61 (1472 – 1532)

1461: 1.61 (1461 – 1507) + 2.00 (1461 – 1514)

1552: 2.94 (1513 – 1552) + 2.94 (1541 – 1552)

1542: 3.33 (1513 – 1542) + 3.33 (1517 – 1542)

1539: 3.57 (1514 – 1539) + 3.57 (1532 – 1539)

1560: 2.38 (1552 – 1560) + 3.13 (1517 – 1560)

Як бачимо, збіжність результатів дуже далека від ідеальної. Так, на кресленні положення 1507 і 1517 практично співпадають, а між ними має бути віддаль 1.19; така сама віддаль мала би бути і між 1532 та 1541. Віддаль між 1472 і 1513 на креслені становить 0.56, тоді як фактично (в таблиці) – 1.61, і так далі (той, хто простежив хід побудови, зауважив, що ці три віддалі не використовувались для побудови діаграми, і тому вони можуть служити для її перевірки).

Разом з тим віддаль 1542 – 1560 на діаграмі становить 6.3, а в таблиці маємо 6.25. Віддаль 1542 – 1552 на діаграмі – так само 6.3, в таблиці – 5.56. Віддаль 1539 – 1542 на діаграмі – 4.8, в таблиці – 5.56. Виходить, великі віддалі між текстами прогнозуються краще, ніж малі.

В цілому діаграму можна поділити на три концентри: відносно щільне ядро (1513, 1517, 1532, 1541), проміжну зону (1472, 1507, 1517, 1520) та зовнішню зону (1461, 1539, 1542, 1552, 1560).

А тепер подивимось, що нам покажуть жорсткі віддалі.

База: 1.02 (1532 – 1514)

1513: 1.06 (1514 – 1513) + 1.09 (1532 – 1513)

1517: 1.11 (1532 – 1517) + 1.16 (1517 – 1513)

1507: 1.11 (1513 – 1507) + 1.11 (1514 – 1507)

1520: 1.19 (1520 – 1513) + 1.22 (1520 – 1514); в масштабі креслення позиція 1520 практично співпадає з позицією 1507, тому умовно пересуваємо 1520 вгору і ліворуч;

1541: 1.19 (1541 – 1517) + 1.22 (1541 – 1514); в масштабі креслення позиція 1541 практично співпадає з позицією 1532, тому умовно пересуваємо 1541 вниз і праворуч;

1472: 1.56 (1514 – 1472) + 1.61 (1517 – 1472);

1461: 2.17 (1472 – 1461) + 2.27 (1507 – 1461);

1539: 4.55 (1539 – 1514) + 4.55 (1539 – 1532);

1542: 6.25 (1542 – 1513) + 6.25 (1542 – 1514);

1552: 3.57 (1552 – 1513) + 3.57 (1552 – 1539);

1560: 2.63 (1560 – 1552) + 4.55 (1560 – 1539);

Кластерний аналіз на основі жорсткої… — Кластерний аналіз на основі жорсткої міри

Проблеми із неузгодженостями малих віддалей, відзначені вище, спостерігаються і тут. Із великими віддалями справа стоїть краще: 1542 – 1560 на діаграмі 10.1, в таблиці – 16.67; 1542 – 1552 на діаграмі 7.6, в таблиці 6.25; 1461 – 1542 на діаграмі 8.94, в таблиці 10.

В цілому поділ текстів на три концентри зберігається і при застосуванні жорсткої міри, хіба що зовнішня зона виглядає виразніше, її відстані від ядра значно більші.

Отже, жорстка міра, котра до певного ступеня враховує структурну подібність / неподібність текстів, здається більш пожиточною.

Залежність текстів можна виразити наступною стеммою:

При її побудові враховано: 1, хронологію документів; 2, спостереження над переліком безспірних об’єктів, винесені на подані вище картосхеми; 3, результати кластерного аналізу.

Текстологія

Розмістіть посилання на цю сторінку
у своєму сайті / блозі / etc.

Рекомендуйте цю сторінку своїм друзям
через соціальні мережі

П.І.Б. (0/64)
Е-адреса (0/64)
Повідомлення (0/1000)

Лист на сайт

Пошук по розділу сайта Текстологія

Посилання на сторінку сайта Текстологія