Национальная база данных?
Национальная база данных?
Такс, операционные системы обсудили, предлагаю пофлеймить на тему Национальной базы данных - не очень освещенная СМИ тема. Что сейчас используется дубненцами: MySQL, PostgreSQL, Oracle, Big Table-like, MS-SQL, другое? Что бы можно было порекомендовать правительству и почему?
ЗЫ: то ли у меня нет прав на создание опроса, то ли слеп стал на старости лет..
ЗЫ: то ли у меня нет прав на создание опроса, то ли слеп стал на старости лет..
Re: Национальная база данных?
Не не ослеп. У меня тоже нет прав создавать голосовалки.LuckyOne писал(а):Такс, операционные системы обсудили, предлагаю пофлеймить на тему Национальной базы данных - не очень освещенная СМИ тема. Что сейчас используется дубненцами: MySQL, PostgreSQL, Oracle, Big Table-like, MS-SQL, другое? Что бы можно было порекомендовать правительству и почему?
ЗЫ: то ли у меня нет прав на создание опроса, то ли слеп стал на старости лет..
Re: Национальная база данных?
Национальная БД - та, которая больше всего подходит к конкретному проекту.
Кому-то надо быть совместимым с каким-то кодом и они выберут MySQL, кому-то там мало возможностей и они выберут Oracle, а кому-то вообще нужна БД, основанная на XML.
Кому-то надо быть совместимым с каким-то кодом и они выберут MySQL, кому-то там мало возможностей и они выберут Oracle, а кому-то вообще нужна БД, основанная на XML.
Re: Национальная база данных?
Да эта БД ещё до официального запуска появится на Савёловском рынке. 

Re: Национальная база данных?
Уточняю: национальная БД это такая БД, в которой хранятся данные 140М россиян. Суммарный обьем - несколько терабайт (для начала), так что про пиратские DVD и XML можно забыть. Интересно знать, с какими БД дубненским экспертам уже приходилось работать? Средними и большими БД - никаких Hsqldb/Derby, Sqlite и прочих..
Для ориентира:
1. Фейсбук - 600M пользователей, MySQL [SQL];
2. Google - дофига М пользователей, Big Table [NoSQL] + MySQL [SQL];
3. ВКонтакте, ~25M пользователей, MySQL [SQL] + собственная СУБД на C;
... ?
Короче, у нас инновационный наукоград, а про базы спросишь так нет никого?
Для ориентира:
1. Фейсбук - 600M пользователей, MySQL [SQL];
2. Google - дофига М пользователей, Big Table [NoSQL] + MySQL [SQL];
3. ВКонтакте, ~25M пользователей, MySQL [SQL] + собственная СУБД на C;
... ?
Короче, у нас инновационный наукоград, а про базы спросишь так нет никого?

Re: Национальная база данных?
Ну, допустим, был я в паре проектов, где MySQL неплохо справлялась. До нагруженности Гугла далековато, но в принципе попадало под категорию "нагруженные".
Понятие "140М" юзеров - очень растяжимое требование при проектировании БД. Одно дело, когда это одна таблица с 140М строк, и совсем другое, когда куча разных таблиц, с высокой сложностью самого легкого запроса по получению сколь-нибудь полезной информации.
Ещё различие - одно дело БД, используемая чиновниками, и совсем другое интернет-проект, куда может присоединиться (с определенным уровнем доступа) хоть чиновник, хоть банковский служащий, хоть гаишник, хоть сам гражданин.
Я бы вот так вслепую в качестве СУБД предложил бы MySQL. В принципе, довольно мощная система. Если при масштабировании потребуется что-то особенное, то проще для этого особенного поставить ещё что-то.
Понятие "140М" юзеров - очень растяжимое требование при проектировании БД. Одно дело, когда это одна таблица с 140М строк, и совсем другое, когда куча разных таблиц, с высокой сложностью самого легкого запроса по получению сколь-нибудь полезной информации.
Ещё различие - одно дело БД, используемая чиновниками, и совсем другое интернет-проект, куда может присоединиться (с определенным уровнем доступа) хоть чиновник, хоть банковский служащий, хоть гаишник, хоть сам гражданин.
Я бы вот так вслепую в качестве СУБД предложил бы MySQL. В принципе, довольно мощная система. Если при масштабировании потребуется что-то особенное, то проще для этого особенного поставить ещё что-то.
Re: Национальная база данных?
NoSQL базы типа BigTable, Hypertable, HBase, MongoDB видел же? Нету там "кучи разных таблиц с высокой сложностью запроса" в принципе Для того и создавались.DOKA писал(а):Понятие "140М" юзеров - очень растяжимое требование при проектировании БД. Одно дело, когда это одна таблица с 140М строк, и совсем другое, когда куча разных таблиц, с высокой сложностью самого легкого запроса по получению сколь-нибудь полезной информации.
Какое дело бэкэнду до того, кем пользователь работает, извиняюсь? В фейсбуке помимо обычных людей полно госслужащих. Чем это интерфейс фейсбука отличен от интерфейсов государственных служб?Ещё различие - одно дело БД, используемая чиновниками, и совсем другое интернет-проект, куда может присоединиться (с определенным уровнем доступа) хоть чиновник, хоть банковский служащий, хоть гаишник, хоть сам гражданин.
Re: Национальная база данных?
А может, окажется, что надо. Или много мелких связных запросов. Я про сложность логики.LuckyOne писал(а): NoSQL базы типа BigTable, Hypertable, HBase, MongoDB видел же? Нету там "кучи разных таблиц с высокой сложностью запроса" в принципе Для того и создавались.
А здесь я про нагрузку говорил, а не про UI.Какое дело бэкэнду до того, кем пользователь работает, извиняюсь? В фейсбуке помимо обычных людей полно госслужащих. Чем это интерфейс фейсбука отличен от интерфейсов государственных служб?
Очевидно, что если к этой БД будет обращаться вся Россия от госслужащих всех видов до самих граждан, то это будет весьма и весьма немалая нагрузка.
Re: Национальная база данных?
Логика в обоих случаях сложная получается.DOKA писал(а):Я про сложность логики
Как же я люблю слово "очевидно", еще со времен ночных бдений над Ландау-Лившицем :)DOKA писал(а):А здесь я про нагрузку говорил, а не про UI.
Очевидно, что если к этой БД будет обращаться вся Россия от госслужащих всех видов до самих граждан, то это будет весьма и весьма немалая нагрузка.
По порядку величины "100 запросов в день от 3М госслужащих" ~= "1 запрос в день от 137М граждан", следовательно служащие отдельно или служащие + граждане = примерно одна и та же нагрузка (пиковые решаются кешированием). На самом деле, не так важен абсолютный порядок нагрузки, как возможности масштабирования базы (horizontal scaling - чёрт знает как это по-русски). Вот это то мне и непонятно: BigTable масштабируется вроде бы получше, но MySQL используется чаще..
Re: Национальная база данных?
в билайне > 100тб хранилище.LuckyOne писал(а):Уточняю: национальная БД это такая БД, в которой хранятся данные 140М россиян. Суммарный обьем - несколько терабайт (для начала), так что про пиратские DVD и XML можно забыть. Интересно знать, с какими БД дубненским экспертам уже приходилось работать? Средними и большими БД - никаких Hsqldb/Derby, Sqlite и прочих..
Для ориентира:
1. Фейсбук - 600M пользователей, MySQL [SQL];
2. Google - дофига М пользователей, Big Table [NoSQL] + MySQL [SQL];
3. ВКонтакте, ~25M пользователей, MySQL [SQL] + собственная СУБД на C;
... ?
Короче, у нас инновационный наукоград, а про базы спросишь так нет никого?
По размерам бд соцсети далеко не первые, если смотреть в разрезе индустрий. Они, один, молодые, два, связанное с один, нет чоткой цели хранения дохера данных и получения из этого бабла. В телекомах и банках и мб ритейлах, типа волмарта, базы больше.
Re: Национальная база данных?
ну и да, перечисленные базы, это олтп базы для операционного процессинга. Там размерами не меряются. Меряются размерами в хранилищах. В хранилищах mysql не бывает.LuckyOne писал(а):Уточняю: национальная БД это такая БД, в которой хранятся данные 140М россиян. Суммарный обьем - несколько терабайт (для начала), так что про пиратские DVD и XML можно забыть. Интересно знать, с какими БД дубненским экспертам уже приходилось работать? Средними и большими БД - никаких Hsqldb/Derby, Sqlite и прочих..
Для ориентира:
1. Фейсбук - 600M пользователей, MySQL [SQL];
2. Google - дофига М пользователей, Big Table [NoSQL] + MySQL [SQL];
3. ВКонтакте, ~25M пользователей, MySQL [SQL] + собственная СУБД на C;
... ?
Короче, у нас инновационный наукоград, а про базы спросишь так нет никого?
Re: Национальная база данных?
Ну а где я упомянул, что нужно хранилище (data warehouse)? Архивы это всегда доступ с большой задержкой, которую телекомы и банки могут легко себе позволить, и оптимизация под аналитику, а не под пользователя. Хранить экзабайты можно и на лентах, это не интересно. Интересно посмотреть живую базу с быстрым доступом, но универсальную и масштабируемую - чтобы не придумывать одну для ГАИ, другую для налогов, третью для просроченных платежей итд. Короче, есть такой реальный опыт у кого-нибудь в Дубне?godzilla писал(а):ну и да, перечисленные базы, это олтп базы для операционного процессинга. Там размерами не меряются. Меряются размерами в хранилищах. В хранилищах mysql не бывает.
А в любом научном центре средней руки - десятки петабайт, и тоже нормально живут. Ну и? Не, я хочу *живую* базу, на пару десятков миллиардов коротких записей, да еще легко масштабируемую, и с временем отклика в пределах секунды для случайной выборки в тысячу записей. Можно аналог time-series, но специально заточенных не надо.godzilla писал(а):в билайне > 100тб хранилище.
У MySQL одна проблема - на шардинге становится тяжеловато, когда количество нод растет. У HyperTable мне не нравится время отклика..
- Filimon Кykyev
- Сообщения: 15458
- Зарегистрирован: 18 апр 2008, 22:15
- Откуда: БВ-ЛБ
- Контактная информация:
Re: Национальная база данных?
Сдается уже появилась (в продаже), по ящику в кримновостях обрадовали, на жестком диске - 14 килорубШвейк писал(а):Да эта БД ещё до официального запуска появится на Савёловском рынке.

Re: Национальная база данных?
Господа, определитесь с терминами. Вы обсуждаете национальную СУБД (MySQL, Posgress, FireBird, Oracle etc) или контент, который появится на Савеловском рынке?
Re: Национальная база данных?
Пока одни думают над технической стороной дела, другие прорабатывают рынки сбыта - всё нормально, как у белых людей :)Вовка писал(а):Господа, определитесь с терминами. Вы обсуждаете национальную СУБД (MySQL, Posgress, FireBird, Oracle etc) или контент, который появится на Савеловском рынке?
- Filimon Кykyev
- Сообщения: 15458
- Зарегистрирован: 18 апр 2008, 22:15
- Откуда: БВ-ЛБ
- Контактная информация:
Re: Национальная база данных?
Прально под рынок сбыта и разрабатывают... 

Re: Национальная база данных?
data warehouse, например teradataLuckyOne писал(а):Уточняю: национальная БД это такая БД, в которой хранятся данные 140М россиян. Суммарный обьем - несколько терабайт (для начала), так что про пиратские DVD и XML можно забыть. Интересно знать, с какими БД дубненским экспертам уже приходилось работать? Средними и большими БД - никаких Hsqldb/Derby, Sqlite и прочих..
Для ориентира:
1. Фейсбук - 600M пользователей, MySQL [SQL];
2. Google - дофига М пользователей, Big Table [NoSQL] + MySQL [SQL];
3. ВКонтакте, ~25M пользователей, MySQL [SQL] + собственная СУБД на C;
... ?
Короче, у нас инновационный наукоград, а про базы спросишь так нет никого?
Избавьтесь от страха и тревоги, и начнется рок-н-ролл
Re: Национальная база данных?
он вархаузы уже забраковал
Re: Национальная база данных?
Все эти национальные базы данных являются предвестниками чипования населения и грядущего Апокалипсиса. 
