pydoop

Een Python MapReduce en HDFS API voor Hadoop
Download nu

pydoop Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • The Apache License 2.0
  • Prijs:
  • FREE
  • Naam uitgever:
  • Simone Leo, Gianluigi Zanetti and Luca Pireddu
  • Uitgever website:

pydoop Tags


pydoop Beschrijving

Pydoop is een Python Mapreduce en HDFS API voor Hadoop. Pydoop gebouwd als een wikkel rond de C ++ API, kunt u full-flutig mapreduct-toepassingen met HDFS-toegang ontwikkelen. Hier is hoe u een standaard Python WordCount met PyDoop Schrijft: van Pydoop.Pipes Import Mapper, Reducer, Fabriek, Runtaskclass WordCountMapper (Mapper): Def Map (Zelf, Context): Woorden = context.getInputValue (). Split () voor W in woorden: context.emit (w, "1") Klasse Wordcountreducer (Reducer): DEF Minder (Zelf, Context): S = 0 Terwijl Context.NextValue (): S + = INT (context.getInputValue ()) Context. Emit (context.getInputkey (), Str (en)) Runtask (fabriek (WordCountMapper, WordCountreducer)) of, voor eenvoudige taken zoals het tellen van Word U kunt het Pydoop_Script-tool proberen. Dan zou uw code worden: Def Mapper (K, Tekst, Schrijver): voor Word in Text.SPLIT (): Writer.emit (Word, 1) Def Reducer (Word, Count, Writer): Writer.emit (Word, Sum (Kaart (INT, COUNT))) De startpagina van het product


pydoop Gerelateerde software

Van_api

Hulpprogramma's om de toegang tot de Vanguardistas-API's uit Python te vergemakkelijken ...

206

Downloaden

ISBN

Een Python ISBN-aanvraag bibliotheek met behulp van http://xisbn.worldcat.org/services ...

39

Downloaden