Czy zastanawiałeś się, jak Google lub Facebook przetwarzają wszystkie swoje dane? Wszystkie te duże zbiory danych! Tak, teraz możesz go również utworzyć. Z Hadoop. Hadoop wywołał niezwykły szum i podniecenie w ostatnich latach. Hadoop, rozproszone środowisko programistyczne typu open source, opiera się na równoległym przetwarzaniu w celu przechowywania i analizowania ogromnych ilości danych ustrukturyzowanych i nieustrukturyzowanych. Niestety, po kilku dniach googlingu, nie mogłem znaleźć żadnej grupy singapurskiej, która zbierałaby się, aby dzielić się i przyczyniać. Niezależnie od tego, czy jesteś początkującym, czy ukrywasz się w szafie doświadczeń, wyjdź, aby podzielić się i wnieść swój wkład. Naszym celem jest stworzenie naszego pierwszego Hadoop. Proszę o pomoc i rozpowszechnianie informacji. Kum Sia. Na początek dołącz do: Hadoop @ SG Co to jest Hadoop?
POMOC: Hadoop - DUŻE dane
Obecnie istnieją 2 szanowane dystrybucje (a) Hortonworks (b) Cloudera Który wolisz ?
chewren123 napisał: Obecnie istnieją 2 szanowane dystrybucje (a) Hortonworks (b) Cloudera Który wolisz ? Jest też Amazon EMR, który warto rozważyć
Cześć davidktw, dzięki za wkład. Dołącz do nas na: Członkowie - Hadoop @ SG (Singapur) - Spotkanie - Miejsce, w którym dzielimy się i uczymy od siebie
tak, nie mogę uwierzyć, że w Singapurze nie ma wiele szumu na temat hadoop.
Cześć głupi (?) Bodo, jesteś absolutnie na miejscu. Próbowałem dowiedzieć się więcej o Hadoop. W Singapurze nie ma miejsca ani społeczności, które umożliwiłyby nam naukę i udostępnianie. Ale jestem zdeterminowany, aby udowodnić, że się mylę. Wreszcie, mamy miłego sponsora JumpAsia, który sponsoruje nam serwer 4-węzłowy. Dołącz do nas na: Członkowie - Hadoop @ SG (Singapur) - Spotkanie - Miejsce, w którym dzielimy się i uczymy od siebie
chewren123 napisał: Cześć głupi (?) Bodo, jesteś absolutnie na miejscu. Próbowałem dowiedzieć się więcej o Hadoop. W Singapurze nie ma miejsca ani społeczności, które umożliwiłyby nam naukę i udostępnianie. Ale jestem zdeterminowany, aby udowodnić, że się mylę. Wreszcie, mamy miłego sponsora JumpAsia, który sponsoruje nam serwer 4-węzłowy. Dołącz do nas na: Członkowie - Hadoop @ SG (Singapur) - Spotkanie - Miejsce, w którym dzielimy się i uczymy od siebie Jeśli chcesz dowiedzieć się, jak skonfigurować własny Hadoop, co powstrzymuje Cię przed używaniem środowiska AWS EC2? Do Twojej dyspozycji są praktycznie nieograniczone zasoby. Może być dość tani, jeśli wykorzystasz instancje spot (w niewłaściwy sposób). Ale oczywiście, jeśli czekasz na kogoś, kto cię sponsoruje, to inna historia.
Sprawdź facetów Accumulo Accumulo | sqrrl | Odblokuj moc Big Data dzięki Apache Accumulo Apache Accumulo © to posortowany, rozproszony magazyn kluczy / wartości. Obsługuje duże ilości ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych danych jako solidny, skalowalny system do przechowywania i wyszukiwania danych w czasie rzeczywistym. Accumulo, pierwotnie opracowane przez NSA od 2008 r., Jest teraz oprogramowaniem typu open source, którego gospodarzem jest Apache Foundation, i naturalnie integruje się z Apache Hadoop. Accumulo jest bazą danych o niskim opóźnieniu i wykorzystuje Hadoop jako system plików do przechowywania.
Amazon EC2 jest świetny. Ale ma swoją cenę: Amazon EC2 Cennik, Pay as you Go dla Cloud Computing Services Pomysł, aby rozpocząć od zera od zera, to ubrudzić rękę, coś w rodzaju samodzielnej wymiany oleju silnikowego w leniwy weekend, zamiast dostać mechanika i zapłacić 100 S $ / -. Stamtąd opcje są otwierane od prostego indeksowania lub rozwiązywania dużych zbiorów danych za pomocą R lub, być może, prostej transformacji do Disco (Erlang / OTP). Dołącz do nas, David i Kellogs. Jesteście ukrytymi smokami i przyczajonymi tygrysami.
Chodzi o społeczność, miejsce do nauki i udostępniania.
« Next Oldest | Next Newest »
Users browsing this thread: 1 Guest(s)