good enough accuracy сойдёт. А ещё реальные данные зашумлены и частенько содержат неправильные метки, так что 100% точности распознавания всё равно не добиться.
Ставлю лойс за раскручивание многообразий многослойными перцептронами.
@ulidtko Гипотеза о том что все кластеры данных выбраны из какого-то многообразия, и то что чем больше у нас сэмплов тем они лучше заполняют его слишком сильная. Так как датасет всегда конечный нейросеть всегда может извернуться и отделить точечки друг от друга (хоть по одной) если слоёв достаточно. И в-третьих данные часто сами с изъяном и в них перепутаны метки некоторых элесентов.
http://en.wikipedia.org/wiki/Iris_flower_data_set вот типичный датасет, тут уже есть перемешивание, и он непохож на многообразие.
@engineer короч то что датасет надо раскручивать как проволочную игрушку это следствие из ложного постулата о том что датасет непрерывный. Он очень разреженный, особенно когда измерений много.