Наши преимущества

База данных на 1 млн. записей

Статус
Закрыто для дальнейших ответов.

svi2009

Турист
Credits
0
Здравствуйте!

Помогите с выбором базы данных за таких условий:
- к-во записей: 1 млн. (в планах до 50 млн.)
- к-во полей: до 30
- информация: текст (списки людей + информация о них);
- задачи: первостепенное - поиск и выборки, второстепенное - редактирование;
- ключевой момент: первостепенный - скорость выборки, второстепенный - размер (в границах 10-30 Гб)
- ОС: Windows
- обслуживание: программа на Delphi;
- локализация: локальная;
- подключение: универсализация (программа + база => скопировал в на другой ПК и запустил без дополнительных настроек и драйверов)

На сегодня проработал 2 варианта:
1) NexusDB - импортнул 300 тыс. записей, проиндексировал по Фамилии
плюс - неплохая скорость выборки на 300 тыс. записях (точный запрос "=" - порядка 10 с., условный "like" - порядка 30 с.) (норма ...)
минус - база уже переваливает за 3 Гб, т.е. на 50 млн. записях это будет порядка 500 Гб (перебор ...)

2) SQLite - импортнул 1 млн. записей, проиндексировал по Фамилии
плюс - небольшой размер базы (около 600 Мб), т.е. на 50 млн. записях это будет порядка 30 Гб (норма ...)
плюс - отличная скорость выборки при точном запросе ("=") - 3-5 с
(супер ...)
минус - при условной выборке ("like") скорость неприемлемая - порядка 5 мин. (перебор ...)

База формируется из txt-файла (экспорт из БД Cronos).

Может я чего-то не учел в SQLite. Под Delphi подключался с помощью DISQLite3 v2.4.5 from Yunga (Как увидеть ссылки? | How to see hidden links?), импортировал txt-файл SQLite Maestro v12.1.0 в ANSI кодировке (кирилица)

Помогите советом или подскажите еще варианты реализации задачи.
 
Like без перебора могут дать только Oracle, MS SQL и может быть DB2 (на счёт неё точно не знаю). Да и то не в переносимых версиях. Для базы таких размеров "переносимая" архитектура, сама по себе, косяк. Подымайте сервис где-нибудь на Amazon EC2 и не морочьте голову.
PS
Правда это будет уже называться не Like, а "полнотекстовый поиск".
 
Последнее редактирование модератором:
Interbase подойдет (сейчас использую на 10 млн записей - проблем нет)

Firebird подойдет тоже. У самого база с 30 млн. записей. Но по стандарту SQL 92 поиск по условию LIKE безиндексный. Ищу методом SRARTING WITH иначе нужно делать что- то вроде полнотекстового поиска.
 
I'm using SQL Server Express with over 4 million record (world cities table).

A very simple query for autocomplete by city name takes between 5 to 13 ms (3 chars as minimum input).

City name field is obviously indexed.
 
MariaDB + sphinx for very quick full text search (about 30ms for 1M row).
Little or no overhead

Добавлено через 1 минуту
... PS I don't know exactly how to index cirillic text, I work on "latin" keymap
 
Последнее редактирование модератором:
У многих производителей есть бесплатные версии своих БД, например Oracle, SQL Server и т.д., у них есть какие-то ограничения, но если про это почитать про них, может вы влезете в эти ограничения.
 
он же написал

- подключение: универсализация (программа + база => скопировал в на другой ПК и запустил без дополнительных настроек и драйверов)
 
а кто мешает тащить, например, установщик sql server 2008 express (только engine) с собой и при запуске проверять установлен или нет. если нет - ставить молча. способ не самый лучший, но имхо для баз с 1 млн записей и больше мелкие базочки - несерьезно.

И про NexusDB немного - вот до чего ж замороченная БД. Уж лучше CE взять, но для него надо с собой таскать фреймворк.
 
я бы предложил sql server 2012 localdb
-20 мб инсталер
-чисто формальная установка - примерно 5 секунд и работает не под администратором
 
Индексация по Фамилии - это по текстовому полю??? Если да, то за счёт такой индексации размер БД будет огромен. И что за БД, которая на 300 тыс. записях поиск осуществляет за 10 секунд? Походу, архитектура БД построена кривовато. Либо очень слабый комп.
 
Статус
Закрыто для дальнейших ответов.
Верх