Hashing_Algorithms

Визуализация результатов

http://alexslav99.pythonanywhere.com/

Лабораторная работа № 2. Сравнение различных подходов к хешированию.

Целью данной работы является сравнение различных методов борьбы с коллизиями:

Метод цепочек;
Метод открытой адресации (см. Кормен, 3-е издание, 11.4 Открытая адреация);
Метод кукушки (см. https://en.wikipedia.org/wiki/Cuckoo_hashing).
Для интереса, предлагается также сделать сравнения со стандартными средствами языка c++: std::map, std::hash_map. Вдруг получится их обогнать. Замечание: В качестве хеш-функций используйте только функции из универсальных семейств, про них рассказывалось на семинарах. Список универсальных хеш-функций можно найти здесь https://en.wikipedia.org/wiki/Universal_hashing. Что измеряется?
Время вставки;
Время удаления;
Время поиска. Более конкретно об измерении: Нужно выбрать какое-то стартовое значение N, скажем 100, выбрать шаг step, скажем пусть step = 100, и выбрать максимальное значение, скажем 100 000. После чего нужно для каждого N с шагом step от минимального значения до максимального построить таблицу размера N (из случайных элементов, или сделать выборку из заранее подготовленной базы) и произвести одну или несколько операций (если несколько, скажем 10, то нужно усреднить). Измеряем именно время одной операции. Некоторые допускают ошибку и делают N вставок с замером времени, но не понятно, что в итоге Вы измерили. Входные данные: a) Случайные натуральные числа. б) Случайные вектора или строки. с) Очень бы хотелось увидеть как поведут себя таблицы на real life данных, например на словарях или словах какого нибудь литературного произведения. Ваш вывод должен содержать:
График зависимости скорости вставки от количества элементов в таблице;
График зависимости скорости удаления от количества элементов в таблице;
График зависимости скорости поиска от количества элементов в таблице; На каждом графике должно быть несколько кривых, по одной или больше для каждого подхода. Заметим также, что таблицы из подходов 1) и 2) имеют дополнительный параметр m – ёмкость таблицы. Хорошо бы построить на графиках кривые для разных значений m, например m = 2n, m = n, m = ½ n. Но это не обязательно.

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
algorithms		algorithms
data		data
evaluator		evaluator
tests		tests
utils		utils
.black		.black
.flake8		.flake8
.gitattributes		.gitattributes
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
LICENSE		LICENSE
README.md		README.md
app.py		app.py
demo_visualization.gif		demo_visualization.gif
main.py		main.py
requirements-dev.txt		requirements-dev.txt
requirements.txt		requirements.txt
setup.py		setup.py
visualize.py		visualize.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hashing_Algorithms

Визуализация результатов

Лабораторная работа № 2. Сравнение различных подходов к хешированию.

About

Releases

Packages

Contributors 2

Languages

License

Lolik-Bolik/Hashing_Algorithms

Folders and files

Latest commit

History

Repository files navigation

Hashing_Algorithms

Визуализация результатов

Лабораторная работа № 2. Сравнение различных подходов к хешированию.

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages