The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Анонсирована СУБД Apache Cassandra 3.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от opennews (??) on 10-Ноя-15, 23:26 
Организация Apache Software Foundation проедставила (https://blogs.apache.org/foundation/entry/the_apache_softwar...) релиз распределённой СУБД Apache Cassandra 3.0 (http://cassandra.apache.org/), относящейся к классу noSQL-систем и рассчитанной на создание высокомасштабируемых и надёжных хранилищ огромных массивов данных, хранимых в форме ассоциативного массива (хэша). Код проекта написан на языке Java и распространяется в рамках лицензии Apache 2.0. Изначально СУБД Cassandra была разработана в недрах компании Facebook и в 2009 году передана под покровительство фонда Apache. Промышленные решения на базе Cassandra, хранящие сотни терабайт данных, охватывающие сотни серверов и способные обрабатывать тысячи запросов в секунду, развернуты для обеспечения сервисов таких компаний и организаций, как Adobe, CERN, Cisco, IBM, HP, Comcast, Disney, eBay, Netflix, Sony, Rackspace, Reddit и Twitter.


Основные новшества (https://git1-us-west.apache.org/repos/asf?p=cassandra.git;a=...):


-  Поддержка  материализованных представлений (http://www.datastax.com/dev/blog/new-in-cassandra-3-0-materi...), позволяющих сформировать виртуальную таблицу на основе произвольного CQL-запроса, содержимое которой не генерируется на лету как в обычных представлениях, а кэшируется между запросами в форме индекса. Материализованное представление может применяться в качестве более эффективной альтернативы вторичным индексам для запросов по непервичным ключам, денормализация данных с разных узлов в которой выполняется на стороне сервера;
-  Полностью переработан (https://issues.apache.org/jira/browse/CASSANDRA-6230) механизм хранения информации о репликах для сбойных узлов ("hinted handoff"), вместо одного файла system.hints хинты теперь записываются в отдельные файлы, что значительно увеличивает эффективность диспетчеризации;
-  Поддержка режима EACH_QUORUM для обеспечения заданного уровня согласованности для запросов на чтение;
-  Поддержка ограничения выборки любых компонентов ключей раздела или кластера через выражение "IN" в директивах UPDATE и DELETE;
-  В директиву DELETE добавлена поддержка отсеивания одно- или многостолбцовых слайсов при помощи операторов ">", ">=", "<=" и "<";
-  В команде "nodetool rebuild_index" теперь можно указывать  индекс, без необходимости указания связанной с ним таблицы;
-  Повышена эффективность хранения данных, что привело к  экономии места в хранилище в среднем  на 50%;
-  Обеспечен вывод предупреждений в лог, если операция сборки мусора выполняется дольше 1000мс.


СУБД Cassandra объединяет в себе полностью распределённую hash-систему Dynamo, обеспечивающую практически линейную масштабируемость при увеличении объема данных. Cassandra использует модель хранения данных на базе семейства столбцов (ColumnFamily), отличающуюся от систем подобных memcachedb, которые хранят данные только в связке ключ/значение, возможностью организовать хранение хэшей с несколькими уровнями вложенности.
Для упрощения взаимодействия с БД поддерживается язык формирования структурированных запросов CQL (http://crlog.info/2011/03/29/cassandra-query-language-aka-cq.../) (Cassandra Query Language), напоминающий SQL, но  урезанный по функциональности. Из возможностей можно отметить поддержку пространств имён и семейств столбцов, создание индексов через выражение "CREATE INDEX".


СУБД позволяет создавать устойчивые к сбоям хранилища: помещаемые в БД данные автоматически реплицируются на несколько узлов распределённой сети, которая может охватывать разные центры обработки данных. При сбое узла, его функции на лету подхватываются другими узлами. Добавление новых узлов в кластер и обновление версии  Cassandra производится на лету, без дополнительного ручного вмешательства и переконфигурирования других узлов.  Драйверы с поддержкой CQL подготовлены для языков Python (https://github.com/datastax/python-driver), Java (https://github.com/datastax/java-driver) (JDBC/DBAPI2), Ruby (https://github.com/datastax/ruby-driver), PHP (https://github.com/datastax/php-driver), C++ (https://github.com/datastax/cpp-driver) и JavaScript (https://github.com/datastax/nodejs-driver) (Node.js).


URL: https://blogs.apache.org/foundation/entry/the_apache_softwar...
Новость: http://www.opennet.me/opennews/art.shtml?num=43298

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


3. "Анонсирована СУБД Apache Cassandra 3.0"  –2 +/
Сообщение от Вареник on 11-Ноя-15, 00:32 
В своей нише (расшадить БД на 10.000 нод) у отой базыне нет альтернантив.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

4. "Анонсирована СУБД Apache Cassandra 3.0"  +4 +/
Сообщение от Аноним (??) on 11-Ноя-15, 02:41 
http://www.opennet.me/opennews/art.shtml?num=43017
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

5. "Анонсирована СУБД Apache Cassandra 3.0"  –1 +/
Сообщение от Классический анонимуз on 11-Ноя-15, 04:50 
СцЫллу только начали писать, и функционал до Кассандры не дотянули даже близко. Внедрений ноль. А тут уже под 10 лет эксплуатации на жирнейших задачах.
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

6. "Анонсирована СУБД Apache Cassandra 3.0"  +5 +/
Сообщение от Аноним (??) on 11-Ноя-15, 05:53 
> СцЫллу только начали писать

Делаем ставки, за сколько месяцев выпрут жабу на помойку после того как СцЫллу допишут.

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

7. "Анонсирована СУБД Apache Cassandra 3.0"  –1 +/
Сообщение от Классический анонимуз on 11-Ноя-15, 06:30 
после того как СцЫллу допишут

ЕСЛИ допишут. После этого лет через 5-10. Печаль фанбоям си?

Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

11. "Анонсирована СУБД Apache Cassandra 3.0"  +3 +/
Сообщение от Аноним (??) on 11-Ноя-15, 08:59 
Допишут-допишут, не волнуйся так. Хоть ты и пытаешься сучить ножками, осознавая, что против плюсового решения у жабы нет шансов, факта это не изменит.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

8. "Анонсирована СУБД Apache Cassandra 3.0"  +2 +/
Сообщение от Аноним (??) on 11-Ноя-15, 08:11 
10000 нод потому что жаба на меньшем не шевелится даже? а постгрес один справился бы?
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

9. "Анонсирована СУБД Apache Cassandra 3.0"  –3 +/
Сообщение от Классический анонимуз on 11-Ноя-15, 08:29 
Так набрасываешь, аж вспотел наверное? А у нас на некоторых задачах джава работает быстрее приплюснутого си. В случае с Кассандрой всё ещё интереснее - она просто работает, а все остальные поделены на ноль и существуют только в сферическо-вакуумных мечтах сишных фанатов

Про постгрес посмеялся...

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "Анонсирована СУБД Apache Cassandra 3.0"  –2 +/
Сообщение от АнонимУася on 11-Ноя-15, 08:54 
>>А у нас на некоторых задачах джава работает быстрее приплюснутого си.

1) Выгоните своих кодеров на плюсах.
2) Расскажите про задачи, на которых жаба задушила плюсы, мы тут посмеяться хотим.

Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

13. "Анонсирована СУБД Apache Cassandra 3.0"  –1 +/
Сообщение от RaSla email on 11-Ноя-15, 09:17 
http://blog.carlesmateo.com/2014/10/13/performance-of-severa.../

JIT (в идеале) написав саму программу 1 РАЗ, позволяет запустить её используя МАКСИМУМ производительности на КОНКРЕТНОМ компе (задействовав оптимальные инструкции КОНКРЕТНОГО процессора)
вместо компиляции С/С++ с флагами оптимизации под каждый тип процессора в "серверной" (а потом ещё и деплоить на каждый сервер "истинно-верную версию" - тоже гемор ещё тот).

Будущее лвиной доли программ Прикладного уровня однозначно за JIT.
А JIT (на данный момент времени) одна из лучших реализаций всё-таки - Oracle Java ...
(к моему сожалению)

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

15. "Анонсирована СУБД Apache Cassandra 3.0"  –2 +/
Сообщение от Классический анонимуз on 11-Ноя-15, 09:31 
Ну например берем список недействительных российских паспортов (с сайта ФМС). 94 млн записей. Надо выделять дельту, т.е. скачали сегодня (сунули в SQL), через пару дней там 94млн+~20k. Надо найти эти 20k и засунуть в SQL.

На джаве за 40 сек отрабатывает на древнем 2.5ггц ксеоне. Сишечка грубо на 20% дольше, плюс саму программу писали в разы дольше.

Жалко, что я в map-reduce не силён, так бы можно было ещё в 4 раза ускорить джавку ;)

p.s. для умников собирающихся покричать "сделай сразу 100млн инсертов", сразу отвечаю - это примерно полчаса средствами ОрацлеЕЕ.

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

21. "Анонсирована СУБД Apache Cassandra 3.0"  +1 +/
Сообщение от Аноним (??) on 11-Ноя-15, 10:52 
Вариант что ты в сишечке анскиллед лузер - в рассчёт не принимается?
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

22. "Анонсирована СУБД Apache Cassandra 3.0"  –1 +/
Сообщение от Классический анонимуз on 11-Ноя-15, 11:47 
Words are cheap (c)

Show you code, Luke! И сюда ссылочку на свой гитхабчик с кучей реактивного кода. Я на том же железе запущу ;)

Ответить | Правка | ^ к родителю #21 | Наверх | Cообщить модератору

32. "Анонсирована СУБД Apache Cassandra 3.0"  +1 +/
Сообщение от . on 12-Ноя-15, 05:55 
>Ну например берем список недействительных российских паспортов (с сайта ФМС). 94 млн записей. ....
>На джаве за 40 сек отрабатывает на древнем 2.5ггц ксеоне. Сишечка грубо на 20% дольше, плюс саму программу писали в разы дольше.

А попробуй тупо: sort list_old > list_old_s; sort list_new > list_new_s; diff list_old_s list_new_s  :-)
А то я пару раз уже наступал когда это уделывало все кассандры\шмасардры\оракакелы :)

Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

35. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от Voland (??) on 16-Ноя-15, 23:40 
В sqlite на десктопной машине с iCore 5 загрузка за 2.5 минуты.
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

18. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от ДяДя on 11-Ноя-15, 10:19 
Есть у вас абстрактный класс. Есть массив, который содержит объекты классов-потомков этого класса. Заранее НЕВОЗМОЖНО знать какие конкретно потомки в этом массиве. Вы перебираете массив, получаете объект и вызываете какой-то метод.

Это в C++ ОЧЕНЬ медленно, т.к. нужно ВСЕГДА залезать в специальную табличку, чтобы понять где находится исполняемый код конкретного потомка.
В Java в рантайме определяется какой конкретный класс в массиве и вызов испоняемого кода инлайнится. Т.о. лезть в табличку при КАЖДОМ вызове метода не нужно. (Раньше было ограничение на то, что в массиве не боле 2-х различных классов. Сейчас не знаю, но в реальной жизни два возникает очень часто).
А таких оптимизаций во время выполнения ОЧЕНЬ много.

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

20. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 11-Ноя-15, 10:51 
Выкидываешь абстрактный класс, и этот кусок пишешь на шаблонах. Всё, жаба начинает реактивно сливать.
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

29. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от demon (??) on 11-Ноя-15, 23:09 
Теретически задача неплохая. А вот каково практическое применение? И главное - нельзя ли конечную практическую задачу решить более простыми методами?
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

30. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от alex (??) on 12-Ноя-15, 01:21 
можно поподробнее, каким образом жава определяет где какой метод инлайнить?
я лично вижу только один способ: хранить в объекте флаг и в вызове метода делать что-то типа:
if(flag)
  do_method1();
else
  do_methd2();
Через switch/case можно расширить на большее разнообразие подклассов.
Но как-то это всё неизящно что-ли.
Дак как там на самом деле? реально интересно
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

19. "Анонсирована СУБД Apache Cassandra 3.0"  +1 +/
Сообщение от Нанобот (ok) on 11-Ноя-15, 10:29 
>1) Выгоните своих кодеров на плюсах.

да! потому что аноним опеннета так сказал!

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

14. "Анонсирована СУБД Apache Cassandra 3.0"  –1 +/
Сообщение от pkdr (ok) on 11-Ноя-15, 09:27 
Справедливости ради, даже несмотря на все "прелести" явы и ставшее притчей во языцех "ява не тормозит(с)" сама по себе кассандра довольно шустрая штука, когда надо писать в базу МНОГО данных.
Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

16. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 11-Ноя-15, 09:33 
Ошибаетесь. Намекну на правильный метод: самой базе необязательно что-либо знать о шардировании.
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

12. "Анонсирована СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 11-Ноя-15, 09:03 
java.. недешево наверно содержать в такой базе данные
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

17. "Анонсирована СУБД Apache Cassandra 3.0"  +1 +/
Сообщение от Аноним (??) on 11-Ноя-15, 09:50 
На самом деле дешевле чем в любой реляционной БД написанной на C, т.к. обычно нужно не только хранить, а еще читать и писать.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

24. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 11-Ноя-15, 14:50 
В ней CAS (прочитать значение и время создания значения - изменить значение с указанным временем создания) реализован?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

25. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 11-Ноя-15, 15:22 
хочу хранить ключ в нескольких копиях (для надежности) но чтобы не было возможно расслоение сети и изменения значения ключа в разных сетях... как тут это можно сделать?

как у меня это сделано сейчаc: я храню ключ в postgres при этом синхронно этот postgres реплицирую. если вдруг postgres сдохнет я его вообще выключу из работы и буду работать с другим.

как бы сделать так же чтобы у ключа были копии но использовались бы они только когда сдох основной сервер при этом копия на сдохшем сервере уже не участвовала в работе.

вообщем меня пугает расслоение данных которое описывали люди ранее, когда есть ключ и есть его копия, потом сеть распадается, в одной копии ключ меняется по одному, в другой по другому и в результате мы теряем данные

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

26. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 11-Ноя-15, 15:38 
EACH_QUORUM is now a supported consistency level for read requests.

те можно хранить скажем 4 копии ключа и требовать чтобы при чтении были доступны все 4 копии, что делать если все 4 не доступны?

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

28. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от одмин on 11-Ноя-15, 19:16 
я бы тебе посоветовал проверить сетевой кабель и кабель питания у всех 4 серверов
Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору

31. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от Аноним (??) on 12-Ноя-15, 02:01 
А если они все на разных континентах?
Ответить | Правка | ^ к родителю #28 | Наверх | Cообщить модератору

33. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от одмин on 12-Ноя-15, 09:39 
тогда нужно или переносить севера в один датацентр или читать документацию такого типа http://www.datastax.com/dev/blog/deploying-cassandra-across-...
Ответить | Правка | ^ к родителю #31 | Наверх | Cообщить модератору

34. "Доступна СУБД Apache Cassandra 3.0"  +/
Сообщение от oooops (??) on 13-Ноя-15, 23:49 
а что говорят относительно производительности и потребления/требований к памяти в новой версии? (по сравнению с 2.2)
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру