Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠšΡ€ΠΎΡΡ-валидация

ΠšΡ€ΠΎΡΡ-валидация ΠΈΠ»ΠΈ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ β€” ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° эмпиричСского оцСнивания ΠΎΠ±ΠΎΠ±Ρ‰Π°ΡŽΡ‰Π΅ΠΉ способности Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ². Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ эмулируСтся Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, которая Π½Π΅ участвуСт Π² ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, Π½ΠΎ для ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ извСстны ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹.

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡ ΠΈ обозначСния [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠŸΡƒΡΡ‚ΡŒ [math] X [/math] β€” мноТСство ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰ΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, Π° [math] Y [/math] β€” ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠ΅ мноТСство ΠΌΠ΅Ρ‚ΠΎΠΊ.

[math]T^l = <(x_i, y_i)>_^, x_i \in X, y_i \in Y[/math] β€” ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π°Ρ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°,

[math]Q[/math] β€” ΠΌΠ΅Ρ€Π° качСства,

[math]\mu: (X \times Y)^l \to A, [/math] β€” Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ обучСния.

Разновидности кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Валидация Π½Π° ΠΎΡ‚Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… (Hold-Out Validation) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠžΠ±ΡƒΡ‡Π°ΡŽΡ‰Π°Ρ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ разбиваСтся Π½Π° Π΄Π²Π΅ части [math] T^l = T^t \cup T^ [/math]

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ПослС Ρ‡Π΅Π³ΠΎ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ΡΡ Π·Π°Π΄Π°Ρ‡Π° ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ:

ΠœΠ΅Ρ‚ΠΎΠ΄ Hold-out примСняСтся Π² случаях Π±ΠΎΠ»ΡŒΡˆΠΈΡ… датасСтов, Ρ‚.ΠΊ. Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ мСньшС Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… мощностСй ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ. НСдостатком ΠΌΠ΅Ρ‚ΠΎΠ΄Π° являСтся Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° сущСствСнно зависит ΠΎΡ‚ разбиСния, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½Π° Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΠΎΠ²Π°Π»Π° Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ обучСния.

Полная кросс-валидация (Complete cross-validation) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π—Π΄Π΅ΡΡŒ число Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ [math]C_l^[/math] становится слишком большим Π΄Π°ΠΆΠ΅ ΠΏΡ€ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠ°Π»Ρ‹Ρ… значСниях t, Ρ‡Ρ‚ΠΎ затрудняСт практичСскоС ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°.

k-fold кросс-валидация [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

КаТдая ΠΈΠ· [math]k[/math] частСй Π΅Π΄ΠΈΠ½ΠΎΠΆΠ΄Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для тСстирования. Как ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, [math]k = 10[/math] (5 Π² случаС ΠΌΠ°Π»ΠΎΠ³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ).

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

tΓ—k-fold кросс-валидация [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠšΡ€ΠΎΡΡ-валидация ΠΏΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ (Leave-One-Out) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Π’Ρ‹Π±ΠΎΡ€ΠΊΠ° разбиваСтся Π½Π° [math]l-1[/math] ΠΈ 1 ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ [math]l[/math] Ρ€Π°Π·.

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²Π° LOO Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Ρ€ΠΎΠ²Π½ΠΎ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· участвуСт Π² ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»Π΅, Π° Π΄Π»ΠΈΠ½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ лишь Π½Π° Π΅Π΄ΠΈΠ½ΠΈΡ†Ρƒ мСньшС Π΄Π»ΠΈΠ½Ρ‹ ΠΏΠΎΠ»Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

НСдостатком LOO являСтся большая Ρ€Π΅ΡΡƒΡ€ΡΠΎΡ‘ΠΌΠΊΠΎΡΡ‚ΡŒ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ приходится [math]L[/math] Ρ€Π°Π·. НСкоторыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ достаточно быстро ΠΏΠ΅Ρ€Π΅Π½Π°ΡΡ‚Ρ€Π°ΠΈΠ²Π°Ρ‚ΡŒ Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΏΡ€ΠΈ Π·Π°ΠΌΠ΅Π½Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° Π΄Ρ€ΡƒΠ³ΠΈΠΌ. Π’ этих случаях вычислСниС LOO удаётся Π·Π°ΠΌΠ΅Ρ‚Π½ΠΎ ΡƒΡΠΊΠΎΡ€ΠΈΡ‚ΡŒ.

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹Π΅ разбиСния (Random subsampling) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Π’Ρ‹Π±ΠΎΡ€ΠΊΠ° разбиваСтся Π² случайной ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΈ. ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° повторяСтся нСсколько Ρ€Π°Π·.

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠšΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ цСлостности ΠΌΠΎΠ΄Π΅Π»ΠΈ (Model consistency criterion) [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

НС ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ части.

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠŸΠ΅Ρ€Π΅ΠΊΡ€Ρ‘ΡΡ‚Π½Π°Ρ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° (кросс-валидация, Cross-validation) β€” ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΡ†Π΅Π½ΠΊΠΈ аналитичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π΅Ρ‘ повСдСния Π½Π° нСзависимых Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΡ€ΠΈ ΠΎΡ†Π΅Π½ΠΊΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΠ΅ΡΡ Π² Π½Π°Π»ΠΈΡ‡ΠΈΠΈ Π΄Π°Π½Π½Ρ‹Π΅ Ρ€Π°Π·Π±ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π½Π° k частСй. Π—Π°Ρ‚Π΅ΠΌ Π½Π° kβˆ’1 частях Π΄Π°Π½Π½Ρ‹Ρ… производится ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π° ΠΎΡΡ‚Π°Π²ΡˆΠ°ΡΡΡ Ρ‡Π°ΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для тСстирования. ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° повторяСтся k Ρ€Π°Π·; Π² ΠΈΡ‚ΠΎΠ³Π΅ каТдая ΠΈΠ· k частСй Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для тСстирования. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ получаСтся ΠΎΡ†Π΅Π½ΠΊΠ° эффСктивности Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ с Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΌ использованиСм ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ Π΄Π°Π½Π½Ρ‹Ρ….

ΠžΠ±Ρ‹Ρ‡Π½ΠΎ кросс-валидация ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² ситуациях, Π³Π΄Π΅ Ρ†Π΅Π»ΡŒΡŽ являСтся прСдсказаниС, ΠΈ Ρ…ΠΎΡ‚Π΅Π»ΠΎΡΡŒ Π±Ρ‹ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ, насколько ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰Π°Ρ модСль способна Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅. Один Ρ†ΠΈΠΊΠ» кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° части, Π·Π°Ρ‚Π΅ΠΌ построСниС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° ΠΎΠ΄Π½ΠΎΠΉ части (Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠΉ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΌ Π½Π°Π±ΠΎΡ€ΠΎΠΌ), ΠΈ валидация ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° Π΄Ρ€ΡƒΠ³ΠΎΠΉ части (Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠΉ тСстовым Π½Π°Π±ΠΎΡ€ΠΎΠΌ). Π§Ρ‚ΠΎΠ±Ρ‹ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ разброс Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ², Ρ€Π°Π·Π½Ρ‹Π΅ Ρ†ΠΈΠΊΠ»Ρ‹ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ проводятся Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… разбиСниях, Π° Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΡƒΡΡ€Π΅Π΄Π½ΡΡŽΡ‚ΡΡ ΠΏΠΎ всСм Ρ†ΠΈΠΊΠ»Π°ΠΌ.

ΠšΡ€ΠΎΡΡ-валидация Π²Π°ΠΆΠ½Π° для Π·Π°Ρ‰ΠΈΡ‚Ρ‹ ΠΎΡ‚ Π³ΠΈΠΏΠΎΡ‚Π΅Π·, навязанных Π΄Π°Π½Π½Ρ‹ΠΌΠΈ («ошибки Ρ‚Ρ€Π΅Ρ‚ΡŒΠ΅Π³ΠΎ Ρ€ΠΎΠ΄Π°Β»), особСнно ΠΊΠΎΠ³Π΄Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π·Π°Ρ‚Ρ€ΡƒΠ΄Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΠ»ΠΈ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ.

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρƒ нас Π΅ΡΡ‚ΡŒ модСль с ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ»ΠΈ нСсколькими нСизвСстными ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ, ΠΈ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ эта модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° (Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€). ΠŸΡ€ΠΎΡ†Π΅ΡΡ ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π΄Π΅Π»Π°Π΅Ρ‚ модСль Π½Π°ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ подходящСй ΠΏΠΎΠ΄ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€, насколько это Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ. Если ΠΌΡ‹ Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ возьмСм нСзависимый ΠΎΠ±Ρ€Π°Π·Π΅Ρ† Π΄Π°Π½Π½Ρ‹Ρ… для Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠ· Ρ‚ΠΎΠ³ΠΎ ΠΆΠ΅ источника, ΠΎΡ‚ΠΊΡƒΠ΄Π° ΠΌΡ‹ взяли Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ обнаруТиваСтся, Ρ‡Ρ‚ΠΎ модСль описываСт тСстовыС Π΄Π°Π½Π½Ρ‹Π΅ Ρ…ΡƒΠΆΠ΅, Ρ‡Π΅ΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€. Π­Ρ‚ΠΎ называСтся ΠΏΠ΅Ρ€Π΅ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΎΠΉ (overfitting), ΠΈ особСнно часто встрСчаСтся Π² ситуациях, ΠΊΠΎΠ³Π΄Π° Ρ€Π°Π·ΠΌΠ΅Ρ€ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π½Π΅Π²Π΅Π»ΠΈΠΊ, ΠΈΠ»ΠΈ ΠΊΠΎΠ³Π΄Π° число ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π²Π΅Π»ΠΈΠΊΠΎ. ΠšΡ€ΠΎΡΡ-валидация это способ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° гипотСтичСском тСстовом Π½Π°Π±ΠΎΡ€Π΅, ΠΊΠΎΠ³Π΄Π° Ρ‚Π°ΠΊΠΎΠΉ Π½Π°Π±ΠΎΡ€ Π² явном Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ.

РаспространСнныС Ρ‚ΠΈΠΏΡ‹ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ

ΠšΡ€ΠΎΡΡ-валидация ΠΏΠΎ K Π±Π»ΠΎΠΊΠ°ΠΌ (K-fold cross-validation)

Π’ этом случаС исходый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… разбиваСтся Π½Π° K ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Ρ… ΠΏΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Ρƒ Π±Π»ΠΎΠΊΠ°. Из K Π±Π»ΠΎΠΊΠΎΠ² ΠΎΠ΄ΠΈΠ½ оставляСтся для тСстирования ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π° ΠΎΡΡ‚Π°ΡŽΡ‰ΠΈΠ΅ΡΡ K-1 Π±Π»ΠΎΠΊΠ° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€. ΠŸΡ€ΠΎΡ†Π΅ΡΡ повторяСтся K Ρ€Π°Π·, ΠΈ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· Π±Π»ΠΎΠΊΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· ΠΊΠ°ΠΊ тСстовый Π½Π°Π±ΠΎΡ€. ΠŸΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ΡΡ K Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ², ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π½Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ Π±Π»ΠΎΠΊ, ΠΎΠ½ΠΈ ΡƒΡΡ€Π΅Π΄Π½ΡΡŽΡ‚ΡΡ ΠΈΠ»ΠΈ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΊΠ°ΠΊΠΈΠΌ-Π»ΠΈΠ±ΠΎ Π΄Ρ€ΡƒΠ³ΠΈΠΌ способом, ΠΈ Π΄Π°ΡŽΡ‚ ΠΎΠ΄Π½Ρƒ ΠΎΡ†Π΅Π½ΠΊΡƒ. ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎ Ρ‚Π°ΠΊΠΎΠ³ΠΎ способа ΠΏΠ΅Ρ€Π΅Π΄ случайным сэмплированиСм (random subsampling) Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ всС наблюдСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΈ для Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΠΈ, ΠΈ для тСстирования ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ наблюдСниС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для тСстирования Π² точности ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π·. Часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ кросс-валидация Π½Π° 10 Π±Π»ΠΎΠΊΠ°Ρ…, Π½ΠΎ ΠΊΠ°ΠΊΠΈΡ…-Ρ‚ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ ΠΏΠΎ Π²Ρ‹Π±ΠΎΡ€Ρƒ числа Π±Π»ΠΎΠΊΠΎΠ² Π½Π΅Ρ‚.

Π’ послойной кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ Π±Π»ΠΎΠΊΠΈ Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎ срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΎΡ‚Π²Π΅Ρ‚Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Ρ€Π°Π²Π½ΠΎ ΠΏΠΎ всСм Π±Π»ΠΎΠΊΠ°ΠΌ.

Валидация ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ случайным сэмплированиСм (random subsampling)

Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅Ρ‚ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ ΠΈ тСстовый Π½Π°Π±ΠΎΡ€Ρ‹. Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚Π°ΠΊΠΎΠ³ΠΎ разбиСния, модСль подгоняСтся ΠΏΠΎΠ΄ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, Π° Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ прСдсказания оцСниваСтся Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π·Π°Ρ‚Π΅ΠΌ ΡƒΡΡ€Π΅Π΄Π½ΡΡŽΡ‚ΡΡ ΠΏΠΎ всСм разбиСниям. ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎ Ρ‚Π°ΠΊΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠΏΠ΅Ρ€Π΅Π΄ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠ΅ΠΉ Π½Π° K Π±Π»ΠΎΠΊΠ°Ρ… Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΈ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ ΠΈ тСстового Π½Π°Π±ΠΎΡ€ΠΎΠ² Π½Π΅ зависят ΠΎΡ‚ числа ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π΅Π½ΠΈΠΉ (Π±Π»ΠΎΠΊΠΎΠ²). НСдостаток ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ наблюдСния ΠΌΠΎΠ³ΡƒΡ‚ Π½ΠΈ Ρ€Π°Π·Ρƒ Π½Π΅ ΠΏΠΎΠΏΠ°ΡΡ‚ΡŒ Π² тСстовый Π½Π°Π±ΠΎΡ€, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΏΠ°ΡΡ‚ΡŒ Π² Π½Π΅Π³ΠΎ Π±ΠΎΠ»Π΅Π΅, Ρ‡Π΅ΠΌ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π·. Π”Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, тСстовыС Π½Π°Π±ΠΎΡ€Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠ΅Ρ€Π΅ΠΊΡ€Ρ‹Π²Π°Ρ‚ΡŒΡΡ. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ разбиСния проводятся случайно, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π±ΡƒΠ΄ΡƒΡ‚ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ Π² случаС ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°.

Π’ послойном Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π΅ этого ΠΌΠ΅Ρ‚ΠΎΠ΄Π°, случайныС Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Ρ‚Π°ΠΊΠΈΠΌ способом, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ срСдний ΠΎΡ‚Π²Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ€Π°Π²Π΅Π½ ΠΏΠΎ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌΡƒ ΠΈ тСстовому Π½Π°Π±ΠΎΡ€Π°ΠΌ. Π­Ρ‚ΠΎ особСнно ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, ΠΊΠΎΠ³Π΄Π° ΠΎΡ‚Π²Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±ΠΈΠ½Π°Ρ€Π΅Π½, с Π½Π΅Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ пропорциями ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² ΠΏΠΎ Π΄Π°Π½Π½Ρ‹ΠΌ.

ΠŸΠΎΡΠ»Π΅ΠΌΠ΅Π½Ρ‚Π½Π°Ρ кросс-валидация (Leave-one-out, LOO)

Π—Π΄Π΅ΡΡŒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠ΅ наблюдСниС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² качСствС тСстового Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π° ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ наблюдСния ΠΈΠ· исходного Π½Π°Π±ΠΎΡ€Π° – Π² качСствС Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ. Π¦ΠΈΠΊΠ» повторяСтся, ΠΏΠΎΠΊΠ° ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ наблюдСниС Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ использовано ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· Π² качСствС тСстового. Π­Ρ‚ΠΎ Ρ‚ΠΎ ΠΆΠ΅ самоС, Ρ‡Ρ‚ΠΎ ΠΈ K-блочная кросс-валидация, Π³Π΄Π΅ K Ρ€Π°Π²Π½ΠΎ числу наблюдСний Π² исходном Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ….

ΠžΡ†Π΅Π½ΠΊΠ° соотвСтствия ΠΌΠΎΠ΄Π΅Π»ΠΈ

ЦСль кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ соотвСтствия ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄Π°Π½Π½Ρ‹ΠΌ, нСзависимым ΠΎΡ‚ Ρ‚Π΅Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… модСль Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Π»Π°ΡΡŒ. Она ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для ΠΎΡ†Π΅Π½ΠΊΠΈ любой количСствСнной ΠΌΠ΅Ρ€Ρ‹ соотвСтствия, подходящСй для Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. НапримСр, для Π·Π°Π΄Π°Ρ‡ΠΈ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ случай Π² тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π±ΡƒΠ΄Π΅Ρ‚ прСдсказан ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΈΠ»ΠΈ Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ. Π’ этой ситуации коэффициСнт ошибки ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован Π² качСствС ΠΎΡ†Π΅Π½ΠΊΠΈ соотвСтствия, хотя ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΎΡ†Π΅Π½ΠΊΠΈ. Если прСдсказываСмоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ распрСдСлСно Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎ, для ΠΎΡ†Π΅Π½ΠΊΠΈ соотвСтствия ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ срСднСквадратичная ошибка, ΠΊΠΎΡ€Π΅Π½ΡŒ ΠΈΠ· срСднСквадратичной ошибки ΠΈΠ»ΠΈ ΠΌΠ΅Π΄ΠΈΠ°Π½Π½ΠΎΠ΅ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎΠ΅ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅.

ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ

ΠšΡ€ΠΎΡΡ-валидация ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для сравнСния Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰Π΅Π³ΠΎ модСлирования. НапримСр, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ интСрСсуСмся оптичСским распознаваниСм символов, ΠΈ рассматриваСм Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ использования Π»ΠΈΠ±ΠΎ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‰ΠΈΡ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² (Support Vector Machines, SVM), Π»ΠΈΠ±ΠΎ k Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй (k nearest neighbors, KNN). Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΌΡ‹ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ‹ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ эти Π΄Π²Π° ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… коэффициСнтов ΠΈΡ… ошибок классификаций. Если ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ просто ΡΡ€Π°Π²Π½ΠΈΠ²Π°Ρ‚ΡŒ эти ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΠΎ ΠΈΡ… ошибкам Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, KNN скорСС всСго ΠΏΠΎΠΊΠ°ΠΆΠ΅Ρ‚ сСбя Π»ΡƒΡ‡ΡˆΠ΅, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½ Π±ΠΎΠ»Π΅Π΅ Π³ΠΈΠ±ΠΎΠΊ ΠΈ ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ склонСн ΠΊ ΠΏΠ΅Ρ€Π΅ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠ΅ ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с SVM.

ΠšΡ€ΠΎΡΡ-валидация Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρƒ нас Π΅ΡΡ‚ΡŒ 20 ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π—Π°Π΄Π°Ρ‡Π° – Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹, использованиС ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… даст модСль с Π»ΡƒΡ‡ΡˆΠΈΠΌΠΈ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΌΠΈ способностями. Если ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΡΡ€Π°Π²Π½ΠΈΠ²Π°Ρ‚ΡŒ подмноТСства ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΏΠΎ ΠΈΡ… ошибкам Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅, Π»ΡƒΡ‡ΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ получатся ΠΏΡ€ΠΈ использовании всСх ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². Однако с кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠ΅ΠΉ, модСль с Π»ΡƒΡ‡ΡˆΠ΅ΠΉ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΡŽ ΠΊ ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΡŽ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ подмноТСство ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ достаточно ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½Ρ‹.

Вопросы Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ

ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ ΠΈ Π½Π΅Π²Π΅Ρ€Π½ΠΎΠ΅ использованиС кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ

ΠšΡ€ΠΎΡΡ-валидация Π΄Π°Π΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΠΌΡ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊΠΎΠ³Π΄Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ тСстовый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… бСрутся ΠΈΠ· ΠΎΠ΄Π½ΠΎΠ³ΠΎ источника, ΠΈΠ· ΠΎΠ΄Π½ΠΎΠΉ популяции. Π’ ΠΌΠ½ΠΎΠ³ΠΈΡ… примСнСниях ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ структура ΠΈΠ·ΡƒΡ‡Π°Π΅ΠΌΠΎΠΉ систСмы мСняСтся со Π²Ρ€Π΅ΠΌΠ΅Π½Π΅ΠΌ. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°Π²ΠΎΠ΄ΠΈΡ‚ΡŒ систСматичСскиС отклонСния Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠ³ΠΎ ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…. К ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ, Ссли модСль для прСдсказания Ρ†Π΅Π½Ρ‹ Π°ΠΊΡ†ΠΈΠΈ трСнируСтся Π½Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ³ΠΎ пятилСтнСго ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π°, нСрСалистично Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ пятилСтний ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ ΠΊΠ°ΠΊ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ ΠΈΠ· Ρ‚ΠΎΠΉ ΠΆΠ΅ самой популяции.

Если выполняСтся ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ, ΠΈ Π½Π°Π±ΠΎΡ€Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· ΠΎΠ΄Π½ΠΎΠΉ популяции, кросс-валидация Π΄Π°Π΅Ρ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ практичСски Π±Π΅Π· смСщСний (bias). Однако, Π΅ΡΡ‚ΡŒ ΠΌΠ½ΠΎΠ³ΠΎ способов ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ. Π’ этом случаС ошибка прСдсказания Π½Π° Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… скорСС всСго Π±ΡƒΠ΄Π΅Ρ‚ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ Ρ…ΡƒΠΆΠ΅, Ρ‡Π΅ΠΌ оТидаСтся ΠΏΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ.

Бпособы Π½Π΅Π²Π΅Ρ€Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ:

1. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ кросс-Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… модСлях, ΠΈ Π²Π·ΡΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

2. ΠŸΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ Π½Π°Ρ‡Π°Π»ΡŒΠ½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· для опрСдСлСния Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΏΠΎΠ»Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…. Если ΠΎΡ‚Π±ΠΎΡ€ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² трСбуСтся Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ прСдсказания, ΠΎΠ½ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. Если кросс-валидация ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для опрСдСлСния Π½Π°Π±ΠΎΡ€Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… модСлью ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ Π΄ΠΎΠ»ΠΆΠ½Π° ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ внутрСнняя кросс-валидация для опрСдСлСния Π½Π°Π±ΠΎΡ€Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ².

3. ΠŸΠΎΠ·Π²ΠΎΠ»ΡΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΏΠΎΠΏΠ°Π΄Π°Ρ‚ΡŒ Ρ‚Π°ΠΊΠΆΠ΅ ΠΈ Π² тСстовый Π½Π°Π±ΠΎΡ€ – это ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠ»ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ ΠΈΠ·-Π·Π° сущСствования Π΄ΡƒΠ±Π»ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… наблюдСний Π² исходном Π½Π°Π±ΠΎΡ€Π΅.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ

ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π» ΠΈΠ· MachineLearning.

Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΈΠ»ΠΈ кросс-ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° ΠΈΠ»ΠΈ кросс-валидация (cross-validation, CV) β€” ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° эмпиричСского оцСнивания ΠΎΠ±ΠΎΠ±Ρ‰Π°ΡŽΡ‰Π΅ΠΉ способности Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹Ρ… ΠΏΠΎ ΠΏΡ€Π΅Ρ†Π΅Π΄Π΅Π½Ρ‚Π°ΠΌ.

ЀиксируСтся Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ мноТСство Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ исходной Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π½Π° Π΄Π²Π΅ ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ: ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΡƒΡŽ ΠΈ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½ΡƒΡŽ. Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ разбиСния выполняСтся настройка Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΏΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, Π·Π°Ρ‚Π΅ΠΌ оцСниваСтся Π΅Π³ΠΎ срСдняя ошибка Π½Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°Ρ… ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½ΠΎΠΉ ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. ΠžΡ†Π΅Π½ΠΊΠΎΠΉ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля называСтся срСдняя ΠΏΠΎ всСм разбиСниям Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° ошибки Π½Π° ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°Ρ….

Если Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° нСзависима, Ρ‚ΠΎ срСдняя ошибка ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля Π΄Π°Ρ‘Ρ‚ Π½Π΅ΡΠΌΠ΅Ρ‰Ρ‘Π½Π½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ вСроятности ошибки. Π­Ρ‚ΠΎ Π²Ρ‹Π³ΠΎΠ΄Π½ΠΎ ΠΎΡ‚Π»ΠΈΡ‡Π°Π΅Ρ‚ Π΅Ρ‘ ΠΎΡ‚ срСднСй ошибки Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, которая ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΠΊΠ°Π·Π°Ρ‚ΡŒΡΡ смСщённой (оптимистичСски Π·Π°Π½ΠΈΠΆΠ΅Π½Π½ΠΎΠΉ) ΠΎΡ†Π΅Π½ΠΊΠΎΠΉ вСроятности ошибки, Ρ‡Ρ‚ΠΎ связано с явлСниСм пСрСобучСния.

Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ являСтся стандартной ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΎΠΉ тСстирования ΠΈ сравнСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² классификации, рСгрСссии ΠΈ прогнозирования.

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡ ΠΈ обозначСния

ΠŸΡƒΡΡ‚ΡŒ β€” мноТСство описаний ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², β€” мноТСство допустимых ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ².

ΠŸΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля

Π Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ Π²ΠΈΠ΄Π°ΠΌΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»Π° качСства ΠΈ способами разбиСния Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

Π”ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π½ΠΈΠ΅

ΠšΡ€ΠΎΠΌΠ΅ срСднСго значСния качСства Π½Π° ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»Π΅ строят Ρ‚Π°ΠΊΠΆΠ΅ Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Ρ‹.

Π’ частности, для получСния Π²Π΅Ρ€Ρ…Π½Π΅ΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ с Π½Π°Π΄Ρ‘ΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ 95% достаточно Π²Π·ΡΡ‚ΡŒ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ.

Π’ частности, для получСния двустороннСй ΠΎΡ†Π΅Π½ΠΊΠΈ с Π½Π°Π΄Ρ‘ΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ 95% достаточно Π²Π·ΡΡ‚ΡŒ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ.

Бтратификация

Бтратификация Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ β€” это способ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ разброс (Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ) ΠΎΡ†Π΅Π½ΠΎΠΊ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‡Π΅Π³ΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ΡΡ Π±ΠΎΠ»Π΅Π΅ ΡƒΠ·ΠΊΠΈΠ΅ Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Ρ‹ ΠΈ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ (tight) Π²Π΅Ρ€Ρ…Π½ΠΈΠ΅ ΠΎΡ†Π΅Π½ΠΊΠΈ.

Бтратификация ΠΏΠΎ вСщСствСнному ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΡƒ. ΠžΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΡΠΎΡ€Ρ‚ΠΈΡ€ΡƒΡŽΡ‚ΡΡ согласно Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΡŽ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠΎ Π²ΠΎΠ·Ρ€Π°ΡΡ‚Π°Π½ΠΈΡŽ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ· ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π—Π°Ρ‚Π΅ΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° разбиваСтся Π½Π° k ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… страт ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠΉ (с Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ Π΄ΠΎ 1) Π΄Π»ΠΈΠ½Ρ‹. ΠŸΡ€ΠΈ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Ρ‹Ρ… Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΈΠ· ΠΊΠ°ΠΆΠ΄ΠΎΠΉ страты выбираСтся ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ, Π»ΠΈΠ±ΠΎ с Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ порядковым Π½ΠΎΠΌΠ΅Ρ€ΠΎΠΌ Π²Π½ΡƒΡ‚Ρ€ΠΈ страты, Π»ΠΈΠ±ΠΎ случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ.

Разновидности ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля

Π’ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля, ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‰ΠΈΠ΅ΡΡ способами разбиСния Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

ΠŸΠΎΠ»Π½Ρ‹ΠΉ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ (complete CV)

ΠžΡ†Π΅Π½ΠΊΠ° ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля строится ΠΏΠΎ всСм разбиСниям. Π’ зависимости ΠΎΡ‚ (Π΄Π»ΠΈΠ½Ρ‹ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ) Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚:

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹Π΅ разбиСния

РазбиСния Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ случайно, нСзависимо ΠΈ равновСроятно ΠΈΠ· мноТСства всСх Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ. ИмСнно для этого случая справСдливы ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½Π½Ρ‹Π΅ Π²Ρ‹ΡˆΠ΅ ΠΎΡ†Π΅Π½ΠΊΠΈ Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»ΠΎΠ². На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ эти ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Π±Π΅Π· ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ пСрСносится ΠΈ Π½Π° Π΄Ρ€ΡƒΠ³ΠΈΠ΅ способы разбиСния Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ Π½Π° ΠΎΡ‚Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… (hold-out CV)

Π­Ρ‚ΠΎΡ‚ способ ΠΈΠΌΠ΅Π΅Ρ‚ сущСствСнныС нСдостатки:

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΏΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ (leave-one-out CV)

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²Π° LOO Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Ρ€ΠΎΠ²Π½ΠΎ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π· участвуСт Π² ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»Π΅, Π° Π΄Π»ΠΈΠ½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ лишь Π½Π° Π΅Π΄ΠΈΠ½ΠΈΡ†Ρƒ мСньшС Π΄Π»ΠΈΠ½Ρ‹ ΠΏΠΎΠ»Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

НСдостатком LOO являСтся большая Ρ€Π΅ΡΡƒΡ€ΡΠΎΡ‘ΠΌΠΊΠΎΡΡ‚ΡŒ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ приходится Ρ€Π°Π·. НСкоторыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ достаточно быстро ΠΏΠ΅Ρ€Π΅Π½Π°ΡΡ‚Ρ€Π°ΠΈΠ²Π°Ρ‚ΡŒ Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΏΡ€ΠΈ Π·Π°ΠΌΠ΅Π½Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° Π΄Ρ€ΡƒΠ³ΠΈΠΌ. Π’ этих случаях вычислСниС LOO удаётся Π·Π°ΠΌΠ΅Ρ‚Π½ΠΎ ΡƒΡΠΊΠΎΡ€ΠΈΡ‚ΡŒ.

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΏΠΎ q Π±Π»ΠΎΠΊΠ°ΠΌ (q-fold CV)

Π’Ρ‹Π±ΠΎΡ€ΠΊΠ° случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ разбиваСтся Π½Π° q Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΡ…ΡΡ Π±Π»ΠΎΠΊΠΎΠ² ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠΉ (ΠΈΠ»ΠΈ ΠΏΠΎΡ‡Ρ‚ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠΉ) Π΄Π»ΠΈΠ½Ρ‹ :

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π±Π»ΠΎΠΊ ΠΏΠΎ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΠΈ становится ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½ΠΎΠΉ ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠΎΠΉ, ΠΏΡ€ΠΈ этом ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ производится ΠΏΠΎ ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹ΠΌ Π±Π»ΠΎΠΊΠ°ΠΌ. ΠšΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ опрСдСляСтся ΠΊΠ°ΠΊ срСдняя ошибка Π½Π° ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½ΠΎΠΉ ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅:

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΏΠΎ rΓ—q Π±Π»ΠΎΠΊΠ°ΠΌ (rΓ—q-fold CV)

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΏΠΎ q Π±Π»ΠΎΠΊΠ°ΠΌ (q-fold CV) повторяСтся r Ρ€Π°Π·. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Ρ€Π°Π· Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ разбиваСтся Π½Π° q Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΡ…ΡΡ Π±Π»ΠΎΠΊΠΎΠ². Π­Ρ‚ΠΎΡ‚ способ наслСдуСт всС прСимущСства q-fold CV, ΠΏΡ€ΠΈ этом появляСтся Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Ρ‚ΡŒ число Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ.

Π”Π°Π½Π½Ρ‹ΠΉ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля, со стратификациСй классов, являСтся стандартной ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΎΠΉ тСстирования ΠΈ сравнСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² классификации. Π’ частности, ΠΎΠ½ примСняСтся Π² систСмах WEKA ΠΈ «Полигон Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ²Β».

Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… прогнозирования

Π’ Π·Π°Π΄Π°Ρ‡Π°Ρ… прогнозирования, динамичСского обучСния, обучСния с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ ΠΈ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ обучСния ΠΏΡ€Π΅Ρ†Π΅Π΄Π΅Π½Ρ‚Ρ‹ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ упорядочСны ΠΏΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΈΡ… появлСния. Π’ этом случаС Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля Π½Π΅ Ρ‚Π°ΠΊ Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹.

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΏΡ€ΠΈ Π½Π°Ρ€Π°ΡΡ‚Π°ΡŽΡ‰Π΅ΠΉ Π΄Π»ΠΈΠ½Π΅ обучСния

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π΄Π»ΠΈΠ½Π° обучСния увСличиваСтся со Π²Ρ€Π΅ΠΌΠ΅Π½Π΅ΠΌ, Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ² ΠΌΠΎΠΆΠ΅Ρ‚ постСпСнно ΡƒΠ»ΡƒΡ‡ΡˆΠ°Ρ‚ΡŒΡΡ. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ±ΠΎΡ‡Π½Ρ‹ΠΉ эффСкт являСтся Π½Π΅ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ, Ссли ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ примСняСтся для оцСнивания качСства Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° обучСния.

ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ ΠΏΡ€ΠΈ фиксированной Π΄Π»ΠΈΠ½Π΅ обучСния

НСдостатки ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля

ΠŸΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ контроля

На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ примСняСтся для ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… критичСски Π²Π°ΠΆΠ½Ρ‹Ρ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΡ… структуру ΠΈΠ»ΠΈ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΈ ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ… ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ нСбольшоС число Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠŸΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½Π°Ρ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ°: руководство для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…

Π”Π°Ρ‚Π° ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ May 24, 2019

Автор: КалСб Нил, Π”Π΅ΠΌΠ΅Ρ‚Ρ€ΠΈ Π’ΠΎΡ€ΠΊΠΌΠ°Π½, Абхинай Π”ΠΎΠΌΠΌΠ°Π»Π°ΠΏΠ°Ρ‚ΠΈ

Π­Ρ‚Π° ΡΡ‚Π°Ρ‚ΡŒΡ ΠΏΡ€ΠΈΠ·Π²Π°Π½Π° ΡΡ‚Π°Ρ‚ΡŒ руководством ΠΊ Π½Π°Ρ‡Π°Π»Ρƒ выполнСния для Ρ‚Ρ€Π΅Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ (hold out, k-fold ΠΈ LOOCV) ΠΈ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΉ, Π»Π΅ΠΆΠ°Ρ‰ΠΈΡ… Π² ΠΈΡ… основС, со ссылками ΠΈ ссылками, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠΌΠΎΠ³ΡƒΡ‚ Π²Π°ΠΌ Π² дальнСйшСм Ρ‡Ρ‚Π΅Π½ΠΈΠΈ. Π’ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ… ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ scikit learn, pandas, numpy ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ python.

Π§Ρ‚ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ рассмотрСно Π² этой ΡΡ‚Π°Ρ‚ΡŒΠ΅:

Π§Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ?

Π£Π΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ

Для этого ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΠ»ΠΈΠ½Π΅ΠΉΠ½Π°Ρ рСгрСссиянаscikit ΡƒΡ‡ΠΈΡ‚ΡŒΡΡΠ±Π°Π·Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠšΠ°Π»ΠΈΡ„ΠΎΡ€Π½ΠΈΠΈ ΠΎ ТильС.

Как Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π΄Π°Π½Π½Ρ‹Π΅ Π±ΡƒΠ΄ΡƒΡ‚ сохранСны Π² ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ, с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π½Π°ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ Π»Π΅Π³Ρ‡Π΅ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ, ΠΌΡ‹ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ΅ΠΌ ΠΈΡ… Π² Ρ„Ρ€Π΅ΠΉΠΌ Π΄Π°Π½Π½Ρ‹Ρ… pandas, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΌ Π±Ρ‹Π»ΠΎ Π»Π΅Π³Ρ‡Π΅ ΠΏΡ€ΠΎΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ ΡƒΠ²ΠΈΠ΄Π΅Π»ΠΈ Π΄Π°Π½Π½Ρ‹Π΅, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π΅ΠΌ, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π°Ρ‡Π°Ρ‚ΡŒ процСсс Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ. ΠŸΡ€ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ΅ нСсогласованности ΠΌΡ‹ раздСляСм Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° Π½Π°Π±ΠΎΡ€ для обучСния ΠΈ тСстирования ΠžΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ Π±ΡƒΠ΄Π΅Ρ‚ Ρ‚Π΅ΠΌ, Π½Π° Ρ‡Π΅ΠΌ создана модСль, ΠΈ Π΄Π°Π½Π½Ρ‹Π΅ тСстирования Π±ΡƒΠ΄ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ сгСнСрированной ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π₯отя Π΅ΡΡ‚ΡŒ (довольно простыС) способы ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ это с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² pandas, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для этого ΠΌΠ΅Ρ‚ΠΎΠ΄ scikit-learns Β«train_test_splitΒ».

Как Π²ΠΈΠ΄ΠΈΡ‚Π΅, ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ Β«train_test_splitΒ» с трСмя ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ: Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ (X) Π΄Π°Π½Π½Ρ‹Π΅, Ρ†Π΅Π»Π΅Π²Ρ‹Π΅ (y) Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ Π±Ρ‹ ΡƒΠ΄Π°Π»ΠΈΡ‚ΡŒ ΠΈ ΠΏΠΎΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒ Π² Π½Π°Π±ΠΎΡ€ тСстовых Π΄Π°Π½Π½Ρ‹Ρ…, Π² Π΄Π°Π½Π½ΠΎΠΌ случаС 25% (ΠΎΠ±Ρ‰ΠΈΠΉ сплит ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ составляСт 70–30, Π² зависимости ΠΎΡ‚Π½Π° мноТСство Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΎ Π²Π°ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…). Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ Π½Π°Π·Π½Π°Ρ‡Π°Π΅ΠΌ Π΄Π°Π½Π½Ρ‹Π΅ раздСлСния X ΠΈ y Π½Π° Π½Π°Π±ΠΎΡ€ Π½ΠΎΠ²Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π½ΠΈΠΌΠΈ ΠΏΠΎΠ·ΠΆΠ΅.

Π’Π°Ρˆ Π²Ρ‹Π²ΠΎΠ΄ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΡΠ²ΠΈΡ‚ΡŒΡΡ Π² этой Ρ‚ΠΎΡ‡ΠΊΠ΅ ΠΊΠ°ΠΊ:

Π’Π΅ΠΏΠ΅Ρ€ΡŒ, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ создали Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСст / ΠΏΠΎΠ΅Π·Π΄, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ модСль ΠΈ ΡΠ³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠ΅Π·Π΄Π°. Π₯отя ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ создания ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π΅ΠΌΠΎΠ½ΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‚ всС большС ΠΈ большС, ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ scikit learn, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π½Π°ΡˆΡƒ Тизнь Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΡ‰Π΅. Π― Π²ΠΊΠ»ΡŽΡ‡ΠΈΠ» нСсколько строк Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ выполнСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ сравнСния.

ΠœΡ‹ Π½Π°Ρ‡Π½Π΅ΠΌ с составлСния Π³Ρ€Π°Ρ„ΠΈΠΊΠ° Π·Π°Π΄Π°Π½Π½Ρ‹Ρ… Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ Ρ†Π΅Π»Π΅Π²Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄Π°Ρ‚ΡŒ Π½Π°ΠΌ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ наша модСль.

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π’ идСальной ΠΌΠΎΠ΄Π΅Π»ΠΈ (Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π² случаС ΠΏΠ΅Ρ€Π΅Ρ…Π²Π°Ρ‚Π°) всС наши Ρ‚ΠΎΡ‡ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… Π±ΡƒΠ΄ΡƒΡ‚ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ Π½Π° этой красной Π»ΠΈΠ½ΠΈΠΈ, Π½ΠΎ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ наши Ρ‚ΠΎΡ‡ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ этой Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΠΈ, ΠΌΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ модСль ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ соотвСтствуСт тСстовым Π΄Π°Π½Π½Ρ‹ΠΌ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΎΡ†Π΅Π½ΠΈΠΌ модСль, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ Π΅Π΅ с ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ.

Π­Ρ‚ΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ! ΠœΡ‹ создали модСль с использованиСм ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, использовали Π΅Π΅ для прогнозирования Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π² Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌ сСгмСнтС тСстовых Π΄Π°Π½Π½Ρ‹Ρ…, Π° Π·Π°Ρ‚Π΅ΠΌ использовали ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΡ†Π΅Π½ΠΊΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ эффСктивности (срСднСквадратичная ошибка) ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎ тСстовым Π΄Π°Π½Π½Ρ‹ΠΌ. Π­Ρ‚ΠΎ Π΄Π°Π΅Ρ‚ Π½Π°ΠΌ ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ Ρ‚ΠΎΠ³ΠΎ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ модСль Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹ΠΌΠΈ Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

Π’Π΅ΠΏΠ΅Ρ€ΡŒ нСсколько Π²Π΅Ρ‰Π΅ΠΉ для рассмотрСния. ΠœΡ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠ»ΠΈ Π½Π°ΡˆΡƒ модСльодин Ρ€Π°Π·, Π§Ρ‚ΠΎ Ссли сдСланный Π½Π°ΠΌΠΈ раскол оказался ΠΎΡ‡Π΅Π½ΡŒ благоприятным для этой ΠΌΠΎΠ΄Π΅Π»ΠΈ? Π§Ρ‚ΠΎ Ссли сдСланный Π½Π°ΠΌΠΈ раскол привнСс большой пСрСкос Π² Π΄Π°Ρ‚Ρƒ? Π Π°Π·Π²Π΅ ΠΌΡ‹ Π½Π΅ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΠ»ΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€ нашСго ΡƒΡ‡Π΅Π±Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Ρ€Π°Π·Π΄Π΅Π»ΠΈΠ² Π΅Π³ΠΎ Ρ‚Π°ΠΊ? Π­Ρ‚ΠΎ нСсколько вопросов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ рассмотрим ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄Π΅ ΠΊ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ΅, Π½ΠΎ сначала нСсколько Π±Π°Π·ΠΎΠ²Ρ‹Ρ… ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΉ.

ΠšΠ°ΠΊΠΎΠ²Ρ‹ отклонСния ΠΈ отклонСния Π² контСкстС ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ?

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΏΡ€Π΅Π΄Π²Π·ΡΡ‚ΠΎΡΡ‚ΡŒ ΠΈ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ, Π΄Π°Π²Π°ΠΉΡ‚Π΅ сначала обратимся ΠΊ модСлям ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠΈ. НаoverfitМодСль гСнСрируСтся, ΠΊΠΎΠ³Π΄Π° модСль Π½Π°ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠ»ΠΎΡ‚Π½ΠΎ вписываСтся Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅, Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ случайный ΡˆΡƒΠΌ ΠΈΠ»ΠΈ Π½Π΅ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ‚Ρ€Π΅Π½Π΄Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ»ΠΈ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Ρ†Π΅Π»Π΅ΠΉ для ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ….UnderfitΠ²ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ‚, ΠΊΠΎΠ³Π΄Π° модСль Π½Π΅ достаточно слоТна для ΡƒΡ‡Π΅Ρ‚Π° ΠΎΠ±Ρ‰ΠΈΡ… Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΠΉ Π² Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ Π±Ρ‹ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ для прогнозирования Ρ†Π΅Π»Π΅ΠΉ Π² ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ использованиС Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ΄Π±ΠΎΡ€Π° для полиномиального Ρ‚Ρ€Π΅Π½Π΄Π°. Π±Ρ‹Ρ‚ΡŒ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹ΠΌΠ’ΠΎΡ‚).

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠŸΡ€ΠΈ создании ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΡ‹ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅ΠΌ нСсколько Ρ‚ΠΈΠΏΠΎΠ² ошибок: ошибка Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ, ошибка тСстирования, ошибка ΠΈΠ·-Π·Π° смСщСния ΠΈ ошибка ΠΈΠ·-Π·Π° диспСрсии Π² ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡΡ…, извСстной ΠΊΠ°ΠΊ компромисс диспСрсии смСщСния (Π΅Ρ‰Π΅ ΠΎΠ΄ΠΈΠ½ большой Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΉ эффСктВот).

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Как ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π»ΠΎΡΡŒ Ρ€Π°Π½Π΅Π΅, ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ Π·Π½Π°Ρ‚ΡŒ, ΠΊΠ°ΠΊ модСль Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Β«Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ ΠΌΠΈΡ€Π΅Β». Частично это являСтся ошибкой ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, которая состоит ΠΈΠ· ошибки ΠΈΠ·-Π·Π° смСщСния ΠΈ ошибки ΠΈΠ·-Π·Π° отклонСния (ошибка обучСния Π½Π΅ Π΄Π°Π΅Ρ‚ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ МодСль Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π±ΡƒΠ΄ΡƒΡ‰ΠΈΠΌΠΈ Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‚Π»ΠΎΠΆΠ΅Π½Π° Π½Π° Π΄Π°Π½Π½Ρ‹ΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚).

ΠœΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ ошибки Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ нахоТдСния Ρ‚ΠΎΡ‡ΠΊΠΈ слоТности ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π³Π΄Π΅ комбинация смСщСния ΠΈ диспСрсионной ошибки ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π°, ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π° связанном Π²ΠΈΠ·ΡƒΠ°Π»Π΅. По ΠΌΠ΅Ρ€Π΅ увСличСния слоТности ΠΌΠΎΠ΄Π΅Π»ΠΈ ошибка ΠΈΠ·-Π·Π° смСщСния ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ, Π° ошибка ΠΈΠ·-Π·Π° диспСрсии увСличиваСтся, создавая компромисс ΠΌΠ΅ΠΆΠ΄Ρƒ диспСрсиСй ΠΈ смСщСниСм, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΌΡ‹ постараСмся ΡƒΡΡ‚Ρ€Π°Π½ΠΈΡ‚ΡŒ ΠΏΠΎΠ·ΠΆΠ΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠΌ смСщСниС ΠΈ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ:

ΠΏΡ€Π΅Π΄Π²Π·ΡΡ‚ΠΎΡΡ‚ΡŒ

ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅

ДиспСрсия опрСдСляСтся ΠΊΠ°ΠΊ ошибка, Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‰Π°Ρ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ измСнчивости ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ прСдсказаниями Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ этого, ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ значСния Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ большого значСния, ΠΊΠ°ΠΊ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠΉ Π² значСниях ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°ΠΌΠΈ. ДиспСрсия Ρ‚Π°ΠΊΠΆΠ΅ становится всС Π±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ½ΠΎΠΉ, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ запускаСм нСсколько испытаний создания ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

Π‘ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ»Π½Ρ‹Π΅ опрСдСлСния ΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹Π΅ эффСктыВот,

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π’ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ смСщСниС ΠΈ диспСрсия часто ΠΎΠ±ΡΡƒΠΆΠ΄Π°ΡŽΡ‚ΡΡ вмСстС ΠΊΠ°ΠΊ «компромисс смСщСния диспСрсии», говоря, Ρ‡Ρ‚ΠΎ минимизация ΠΎΠ΄Π½ΠΎΠΉ ошибки эффСктивно ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ появлСния ошибки ΠΏΡ€ΠΈ создании ΠΈ ΠΎΡ†Π΅Π½ΠΊΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ ΠΈΠ΄Π΅Π°Π»Π΅, ΠΌΡ‹ Π±Ρ‹ искали модСль, компромисс ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊΠΈ Ρ‚ΠΎ ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠ΅Π½ΠΈΠ·ΠΊΠΈΠΉ ΡƒΠΊΠ»ΠΎΠ½ ΠΈ низкая диспСрсия, ΠΈ ΠΌΡ‹ надССмся Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ этого с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ. Π’ зависимости ΠΎΡ‚ характСристик Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΠ΄ΠΈΠ½ ΠΌΠ΅Ρ‚ΠΎΠ΄ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, вСроятно, Π±ΡƒΠ΄Π΅Ρ‚ Π±ΠΎΠ»Π΅Π΅ ΠΈΠ΄Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ для достиТСния компромисса смСщСния ΠΏΡ€ΠΈ создании ΠΈ ΠΎΡ†Π΅Π½ΠΊΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π§Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ пСрСкрСстная ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ°?

Π§Ρ‚ΠΎ Ссли сдСланный Π½Π°ΠΌΠΈ раскол оказался ΠΎΡ‡Π΅Π½ΡŒ благоприятным для этой ΠΌΠΎΠ΄Π΅Π»ΠΈ? Π§Ρ‚ΠΎ Ссли сдСланный Π½Π°ΠΌΠΈ раскол привнСс большой пСрСкос Π² Π΄Π°Ρ‚Ρƒ? Π Π°Π·Π²Π΅ ΠΌΡ‹ Π½Π΅ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΠ»ΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€ нашСго ΡƒΡ‡Π΅Π±Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Ρ€Π°Π·Π΄Π΅Π»ΠΈΠ² Π΅Π³ΠΎ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ?

K-Fold Cross Validation

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠŸΡ€ΠΈ Π²Ρ‹Π±ΠΎΡ€Π΅ значСния дляКкаТдая складка (Π³Ρ€ΡƒΠΏΠΏΠ°) Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ достаточно большой, Ρ‡Ρ‚ΠΎΠ±Ρ‹ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚Π΅Π»ΡŒΠΌΠΎΠ΄Π΅Π»ΠΈ (ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΊ = 10 ΠΈΠ»ΠΈ ΠΊ = 5) ΠΈ достаточно ΠΌΠ°Π», Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π±Ρ‹Ρ‚ΡŒ рассчитанным Π² Ρ€Π°Π·ΡƒΠΌΠ½Ρ‹Π΅ сроки. Π’ зависимости ΠΎΡ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ½ΠΎΠ³Π΄Π° ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ значСниями k. Как ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, ΠΊΠ°ΠΊΠšΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ΡΡ, смСщСниС ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ ΠΈ диспСрсия увСличиваСтся.

Π”Π°Π²Π°ΠΉΡ‚Π΅ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ, хотя ΠΏΡ€ΠΈΠΌΠ΅Ρ€ с нашим Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· Ρ€Π°Π½Π΅Π΅.

ΠœΡ‹ снова Π²ΠΎΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡΡ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ модСлью, Π½ΠΎ Π½Π° этот Ρ€Π°Π· ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅ΠΌ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° cross_val_predict scikit learn, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сдСлаСт Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ тяТСлой Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΡ€ΠΈ создании прСдсказаний K-Fold. Π’ этом случаС я Ρ€Π΅ΡˆΠΈΠ» ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒΠΊ = 10,

Π’Ρ‹Π²ΠΎΠ΄ (ΠΈΠ»ΠΈ ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ):

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π΄Π°Π²Π°ΠΉΡ‚Π΅ возьмСм ΠΎΡ†Π΅Π½ΠΊΠΈ 10 сгСнСрированных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ прСдставим ΠΈΡ… Π² Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ.

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π’Ρ‹ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚Π΅, Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ Π½ΠΈΠΆΠ΅ нуля, Ρ‡Π΅ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ удСрТания (Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ). ΠœΡ‹ обсудим это ΠΏΠΎΠ·ΠΆΠ΅.

ΠžΡΡ‚Π°Π²ΡŒΡ‚Π΅ ΠΎΠ΄Π½Ρƒ ΠΏΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ

Leave One Out Cross Validation (LOOCV) ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ Ρ‚ΠΈΠΏ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ K-Fold, Π³Π΄Π΅ΠΊ = ΠΏΠ΄Π°Π½Π½Ρ‹ΠΉNэто количСство строк Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. ΠšΡ€ΠΎΠΌΠ΅ этого ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΠΎΡ‡Ρ‚ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹. Однако Π²Ρ‹ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚Π΅, Ρ‡Ρ‚ΠΎ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ ΠΊΠΎΠ΄Π° Π·Π°ΠΉΠΌΠ΅Ρ‚ΠΌΠ½ΠΎΠ³ΠΎΠ΄ΠΎΠ»ΡŒΡˆΠ΅, Ρ‡Π΅ΠΌ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹. ΠœΡ‹ углубимся Π² это ΠΏΠΎΠ·ΠΆΠ΅.

Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим ΠΏΡ€ΠΈΠΌΠ΅Ρ€ с Ρ‚Π΅ΠΌ ΠΆΠ΅ Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ…, слСдуя Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅ процСссу ΠΈ измСняяК:

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ГСнСрация ΠΈ срСдняя ΠΎΡ†Π΅Π½ΠΊΠ°:

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π΄Π°Π²Π°ΠΉΡ‚Π΅ сравним врСмя выполнСния ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ Π½Π°ΡˆΠΈΡ… Ρ‚Ρ€Π΅Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ²:

Π”Π°Π²Π°ΠΉΡ‚Π΅ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ углубимся Π² эти Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ вопросы, поднятыС Ρ€Π°Π½Π΅Π΅.

Π“Π΄Π΅ ΠΈ ΠΊΠΎΠ³Π΄Π° Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Ρ‹ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹?

Как ΠΌΡ‹ Π·Π°ΠΌΠ΅Ρ‚ΠΈΠ»ΠΈ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°Ρ… нашСго сравнСния, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π²ΠΈΠ΄Π΅Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ LOOCV ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ΠΏΡƒΡ‚ΡŒΠ΄ΠΎΠ»ΡŒΡˆΠ΅, Ρ‡Π΅ΠΌ Π΄Π²Π° Π΄Ρ€ΡƒΠ³ΠΈΡ…. Π­Ρ‚ΠΎ связано с Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ этот ΠΌΠ΅Ρ‚ΠΎΠ΄ создаСт ΠΈ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅Ρ‚ модСль для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ строки Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, Π² Π΄Π°Π½Π½ΠΎΠΌ случаС Π±ΠΎΠ»Π΅Π΅ 20000. Π₯отя наш MSE Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ Π½ΠΈΠΆΠ΅, это ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π΅ ΡΡ‚ΠΎΠΈΡ‚ΡŒ этого, учитывая Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ трСбования. Π’ΠΎΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ эвристики, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ Π² Π²Ρ‹Π±ΠΎΡ€Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°.

ΠŸΡ€ΠΎΡ‚ΡΠ½ΡƒΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄

ΠœΠ΅Ρ‚ΠΎΠ΄ удСрТания ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ эффСктивным ΠΈ Π½Π΅Π΄ΠΎΡ€ΠΎΠ³ΠΈΠΌ Π² Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ для ΠΎΡ‡Π΅Π½ΡŒ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ для ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹Ρ… Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… рСсурсов. Π­Ρ‚ΠΎ Ρ‚Π°ΠΊΠΆΠ΅ часто Π»Π΅Π³Ρ‡Π΅ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΏΠΎΠ½ΡΡ‚ΡŒ для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, ΠΎΡ‡Π΅Π½ΡŒ Ρ€Π΅Π΄ΠΊΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ ΠΊ нСбольшим Π½Π°Π±ΠΎΡ€Π°ΠΌ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ это ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ доступныС Π΄Π°Π½Π½Ρ‹Π΅ обучСния ΠΈ ΡƒΡ…ΡƒΠ΄ΡˆΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

K-Fold Cross Validation

K-Fold ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ эффСктивСн для Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… срСднСго Ρ€Π°Π·ΠΌΠ΅Ρ€Π°, хотя, рСгулируя Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ K, ΠΌΠΎΠΆΠ½ΠΎ сущСствСнно ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ. Π”Π°Π²Π°ΠΉΡ‚Π΅ Π΄ΠΎΠ±Π°Π²ΠΈΠΌ ΠΊ Π½Π°ΡˆΠ΅ΠΌΡƒ ΠΏΡ€Π°Π²ΠΈΠ»Ρƒ ΠΈΠ· Ρ€Π°Π½Π΅Π΅; с ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ k смСщСниС ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ, Π° диспСрсия ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ трСбования Π²ΠΎΠ·Ρ€Π°ΡΡ‚Π°ΡŽΡ‚. ΠŸΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½Π°Ρ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° K-Fold, вСроятно, являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ распространСнным ΠΈΠ· Ρ‚Ρ€Π΅Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΈΠ·-Π·Π° ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²ΠΊΠΈ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ K.

LOOCV

LOOCV Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ»Π΅Π·Π΅Π½ Π² Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½ позволяСт ΡƒΠ΄Π°Π»ΡΡ‚ΡŒ наимСньшСС количСство Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ. Однако Π² Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… процСсс Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ строки Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ нСвСроятно дорогостоящим Π² Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΡ€Π΅ΠΏΡΡ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌ для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ….

ΠšΠ°ΠΊΠΎΠ²Ρ‹ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ прСимущСства ΠΈ нСдостатки Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ?

Π£Π΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅ Валидация

ΠŸΡ€ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ΅ нСсогласованности ΠΌΡ‹ Π΄Π΅Π»Π°Π΅ΠΌ Π½Π΅ Ρ‡Ρ‚ΠΎ ΠΈΠ½ΠΎΠ΅, ΠΊΠ°ΠΊ простоС Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ ΠΏΠΎΠ΅Π·Π΄Π° / тСста, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΌΡ‹ подгоняСм Π½Π°ΡˆΡƒ модСль ΠΊ нашим Π΄Π°Π½Π½Ρ‹ΠΌ обучСния ΠΈ примСняСм Π΅Π΅ ΠΊ нашим Π΄Π°Π½Π½Ρ‹ΠΌ тСстирования для получСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. ΠœΡ‹ Β«Π΄Π΅Ρ€ΠΆΠΈΠΌΒ» Π΄Π°Π½Π½Ρ‹Π΅ тСстирования, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±ΡƒΠ΄ΡƒΡ‚ строго ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² цСлях прогнозирования. Π£Π΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π½Π΅ являСтся ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ. Но ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΎΠ±ΡΡƒΠ΄ΠΈΡ‚ΡŒ стандартный ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΌΡ‹ ΠΌΠΎΠ³Π»ΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ Π΅Π΅ Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ с фактичСскими ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ.

Когда Π΄Π΅Π»ΠΎ Π΄ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Π΄ΠΎ ΠΊΠΎΠ΄Π°, нСслоТная ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° проста Π² использовании. РСализация проста ΠΈ Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π·Π°Ρ‚Ρ€Π°Ρ‚ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ мощности ΠΈ слоТности Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π‘ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΠ³ΠΎ, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ нСсогласованности, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½ΠΈ Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ ΠΎΡ‚ нас выяснСния Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ΡΡ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ Π² ΠΎΠ±Ρ‰Π΅ΠΉ схСмС Π²Π΅Ρ‰Π΅ΠΉ.

Однако ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° достовСрности Π½Π΅ сохраняСт ΡΡ‚Π°Ρ‚ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ†Π΅Π»ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… случаях. НапримСр, нСсогласованная валидация, которая Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅Ρ‚ Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° сСгмСнты обучСния ΠΈ тСстирования, ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ ΡΠΌΠ΅Ρ‰Π΅Π½ΠΈΡŽ, Ссли Π½Π΅ Π²ΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ тСстирования Π² модСль. Π”Π°Π½Π½Ρ‹Π΅ тСстирования ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Π°ΠΆΠ½Ρ‹Π΅ наблюдСния. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ привСсти ΠΊ сниТСнию точности ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, это ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Ρ‚ ΠΊ Π½Π΅ΠΏΠΎΠ»Π½ΠΎΠΌΡƒ ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠ΅ ΠΈ ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΊ ввСдСнию ошибки ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΈ / ΠΈΠ»ΠΈ обучСния.
K-ΠΊΡ€Π°Ρ‚Π½Ρ‹ΠΉ

Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ мощности, пСрСкрСстная ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π² k-ΠΊΡ€Π°Ρ‚Π½ΠΎΠΌ Ρ€Π°Π·ΠΌΠ΅Ρ€Π΅ ΠΎΡ‡Π΅Π½ΡŒ Π·Π°Ρ‚Ρ€Π°Ρ‚Π½Π°. ΠšΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ нСсколько ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ точности. ΠžΡ†Π΅Π½ΠΊΠ° точности ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² Ρ‚Π΅ΠΎΡ€ΠΈΠΈ Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Ρ‚ΡŒΡΡ с ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Π½ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠ΅ΠΉ. Π­Ρ‚ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ смСщСниС ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ. ΠœΡ‹ ΡƒΠ²ΠΈΠ΄ΠΈΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ этого ΠΏΠΎΠ·ΠΆΠ΅ Π² этой ΡΡ‚Π°Ρ‚ΡŒΠ΅, ΠΊΠΎΠ³Π΄Π° попытаСмся ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ k-ΠΊΡ€Π°Ρ‚Π½ΡƒΡŽ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΡŽ ΠΊ ΠΎΡ‡Π΅Π½ΡŒ Π±ΠΎΠ»ΡŒΡˆΠΎΠΌΡƒ Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ содСрТит ΠΎΠΊΠΎΠ»ΠΎ 580 000 наблюдСний.

LOOCV

LOOCV ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆ Π½Π° K-fold, с особым случаСм, ΠΊΠΎΠ³Π΄Π° k Ρ€Π°Π²Π½ΠΎ Π΄Π»ΠΈΠ½Π΅ (ΠΈΠ»ΠΈ количСству Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ / рядов) всСго Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π΄Π»ΠΈΠ½Ρƒ k-1, Π° тСстовый Π½Π°Π±ΠΎΡ€ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ собой ΠΎΠ΄Π½Ρƒ Π²Ρ‹Π±ΠΎΡ€ΠΊΡƒ Π΄Π°Π½Π½Ρ‹Ρ…. LOOCV особСнно ΠΏΠΎΠ»Π΅Π·Π΅Π½ Π² Ρ‚ΠΎΠΌ случаС, Ссли наш Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… нСдостаточно Π²Π΅Π»ΠΈΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°Π·ΡƒΠΌΠ½ΠΎ Π΄Π΅Π»Π°Ρ‚ΡŒ Kfold. LOOCV Ρ‚Π°ΠΊΠΆΠ΅ Π² Ρ†Π΅Π»ΠΎΠΌ ΠΌΠ΅Π½Π΅Π΅ Π·Π°Ρ‚Ρ€Π°Ρ‚Π΅Π½ Π² Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ, хотя ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ это происходит ΠΈΠ·-Π·Π° ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ ΠΌΠ΅Π½ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ стрСмятся Π΅Π³ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ.

Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅, LOOCV ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΡŽ Π΄Π°Π²Π°Ρ‚ΡŒ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ ΠΈΠ·-Π·Π° Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠΎΠ΄Π±ΠΈΡ€Π°Ρ‚ΡŒ всС Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ значСния ΡˆΡƒΠΌΠ° ΠΈ выбросов Π² Π΄Π°Π½Π½Ρ‹Ρ… Ρ‡Π΅Ρ€Π΅Π· ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ значСния тСстирования. LOOCV Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π΄ΠΎΡ€ΠΎΠ³ΠΈΠΌ для ΠΎΡ‡Π΅Π½ΡŒ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…; Π² этом случаС Π±Ρ‹Π»ΠΎ Π±Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹ΠΉ K-Fold.

Когда Π²Ρ‹ Π½Π΅ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ?

ΠŸΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½Π°Ρ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° становится Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ дорогостоящим ΠΈ ΠΎΠ±Ρ€Π΅ΠΌΠ΅Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с большими Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. ГСнСрация Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π° Π² ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΌ ΠΈΡ‚ΠΎΠ³Π΅ Π·Π°Π½ΠΈΠΌΠ°Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ½ΠΎΠ³ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒΡΡ k Ρ€Π°Π· Π² стратСгии K-Fold, итСрируя ΠΏΠΎ всСму Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, пСрСкрСстная ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° становится ΠΎΡ‡Π΅Π½ΡŒ Π΄ΠΎΡ€ΠΎΠ³ΠΎΠΉ стратСгиСй ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния слоТности Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. ΠœΡ‹ исслСдуСм это явлСниС, Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΠ² ΠΎΠ±Ρ‹Ρ‡Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ удСрТания ΠΈ ΠΏΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ K-Fold Π½Π°ΠΎΡ‡Π΅Π½ΡŒ большой Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ 580 000 строк, ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅, смоТСтС Π»ΠΈ Π²Ρ‹ Π²Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒ, ΠΏΠΎΡ‡Π΅ΠΌΡƒ это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Ρ‚Π°ΠΊ (ΠΈ Π½ΠΎΠ²Ρ‹Π΅ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π΄Π°Π½Π½Ρ‹Ρ…), ΠΈ ΠΏΡ€ΠΎΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚ΠΈΡ€ΡƒΠΉΡ‚Π΅ Π»ΡŽΠ±Ρ‹Π΅ вопросы. Π£Π΄Π°Ρ‡ΠΈ!

Π’ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π² Ρ‚Ρ€ΠΈ Ρ€Π°Π·Π°: 0,8016822371999202
ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° K-Fold Π·Π°Π½ΠΈΠΌΠ°Π΅Ρ‚ 1001,0495188236237 сСкунд.

[[166004 46040 27 0 243 43 1902]
[41396 225886 1919 4 1808 1156 293]
[59 3704 31832 442 143 1591 0]
[0 7 267 2119 0 124 0]
[539 4504 208 0 7251 68 5]
[50 2434 1501 182 44 14385 0]
[3792 726 0 0 4 0 18310]]

Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Π€ΠΎΡ‚ΠΎ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ кросс валидация Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

Π—Π°Π΄Π΅Ρ€ΠΆΠΊΠ° ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ:

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ условия:

ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ:Π›ΡŽΠ±ΠΎΠΉ процСсс, с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ сгСнСрированная модСль свСряСтся с Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈΠ½Π΅ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² процСссС Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ. НапримСр. пСрСкрСстная ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ°, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° K-Fold, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° достовСрности ΠΈ Ρ‚. Π΄.
ΠŸΠ΅Ρ€Π΅ΠΊΡ€Π΅ΡΡ‚Π½Π°Ρ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ°:
Π’ΠΈΠΏ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ нСсколько подмноТСств Π΄Π°Π½Π½ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… ΡΠΎΠ·Π΄Π°ΡŽΡ‚ΡΡ ΠΈ ΡΠ²Π΅Ρ€ΡΡŽΡ‚ΡΡ Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ, ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ с использованиСм ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°, Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‰Π΅Π³ΠΎ создания ряда ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, эквивалСнтных количСству сгСнСрированных Π³Ρ€ΡƒΠΏΠΏ.
K-Fold Cross Validation:
Π’ΠΈΠΏ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, ΠΊΠΎΠ³Π΄Π° Π΄Π°Π½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… разбиваСтся Π½Π°ΠšΠΊΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ Π³Ρ€ΡƒΠΏΠΏ ΠΈΠšΠΊΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ гСнСрируСтся. Одна ΠΈΠ· Π³Ρ€ΡƒΠΏΠΏ Π²Ρ‹Π±Ρ€Π°Π½Π° Π² качСствС тСстовых Π΄Π°Π½Π½Ρ‹Ρ…, Π° другаяк-1Π³Ρ€ΡƒΠΏΠΏΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² качСствС ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, Π° модСль гСнСрируСтся ΠΈ оцСниваСтся. Π­Ρ‚ΠΎΡ‚ процСсс ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΡΠ΅Ρ‚ΡΡΠšΠ²Ρ€Π΅ΠΌΠ΅Π½Π° Ρ‚Π°ΠΊΠΈΠ΅, Ρ‡Ρ‚ΠΎ каТдая k-кратная (Π³Ρ€ΡƒΠΏΠΏΠ°) слуТит Π² качСствС Π³Ρ€ΡƒΠΏΠΏΡ‹ тСстирования ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π·.
LOOCV:
Π’ΠΈΠΏ пСрСкрСстной ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ, Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ΅ K-Fold, Π³Π΄Π΅ΠšΡ€Π°Π²Π½Π° Π΄Π»ΠΈΠ½Π΅ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ выполняСтся ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ°.
Π£ΠΊΠ»ΠΎΠ½:
Ошибка, Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‰Π°Ρ ΠΈΠ·-Π·Π° Ρ€Π°Π·Π½ΠΈΡ†Ρ‹ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ (ями) ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ фактичСским (ΠΈΠ»ΠΈ Β«ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹ΠΌΒ») Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ (ями), ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ. Π’ Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… прСдставлСниях ΠΎ точности ΠΈ точности ΠΏΡ€Π΅Π΄Π²Π·ΡΡ‚ΠΎΡΡ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ.
Π Π°Π·Π½ΠΈΡ†Π°:
Ошибка Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ измСнчивости ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ прСдсказаниями Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ этого, ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ значСния Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ большого значСния, ΠΊΠ°ΠΊ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠΉ Π² значСниях ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°ΠΌΠΈ. ДиспСрсия Ρ‚Π°ΠΊΠΆΠ΅ становится всС Π±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ½ΠΎΠΉ, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ запускаСм нСсколько испытаний создания ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.
Подгонка:
ΠŸΡ€ΠΎΠΈΡΡ…ΠΎΠ΄ΠΈΡ‚, ΠΊΠΎΠ³Π΄Π° модСль Π½Π°ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠ»ΠΎΡ‚Π½ΠΎ вписываСтся Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅, Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ случайный ΡˆΡƒΠΌ ΠΈΠ»ΠΈ Π½Π΅ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Ρ‚Ρ€Π΅Π½Π΄Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ»ΠΈ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Ρ†Π΅Π»Π΅ΠΉ для ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ….
Π‘ΠΎΠ»Π΅Π΅ подходят:
ΠŸΡ€ΠΎΠΈΡΡ…ΠΎΠ΄ΠΈΡ‚, ΠΊΠΎΠ³Π΄Π° модСль нСдостаточно слоТна для ΡƒΡ‡Π΅Ρ‚Π° ΠΎΠ±Ρ‰ΠΈΡ… Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΠΉ Π² Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ Ρ†Π΅Π»Π΅ΠΉ Π² ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΡ€ΠΈ использовании Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ соотвСтствия полиномиальной Ρ‚Π΅Π½Π΄Π΅Π½Ρ†ΠΈΠΈ.
ΠžΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ ΠΎΡ‚ смСщСния:
ИдСя, Ρ‡Ρ‚ΠΎ ΠΈΠ·-Π·Π° ошибки ΠΈΠ·-Π·Π° смСщСния ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ ошибка ΠΈΠ·-Π·Π° увСличСния диспСрсии, создаСт компромисс, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ слСдуСт ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈ Π²Π°Π»ΠΈΠ΄Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΎΠ±ΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΡΡ‚Π²Π°Ρ….

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *