Реализация (использование) вероятностного алгоритма Взять готовую реализацию одного из алгоритмов: Bloom Filter, MinHash, SimHash, HyperLogLog или Count-Min Sketch для вашего языка программирования для ее изучения; изучить код реализации; вариант повышенной сложности (опционально): самим реализовать этот алгоритм; найти большой датасет, подходящий для выбранного алгоритма; применить ее для решения практической задачи: например, определить, принаджежит ли элемент множеству, подсчитать число уникальных элементов в большом массиве данных или подсчитать числа вхождений каждого элемента в большой массив данных; оценить точность реализации (% ошибок, false positives и т.д.) с помощью тестов; выложить ваш код вместе с датасетом; (опционально): сделать вышеперечисленное для еще одного алгоритма из списка. (опционально): сравнить между собой "парные" алгоритмы, если вы выбрали их (напр, MinHash и SimHash).