Opiniones sobre Cómo ejecutar trabajos de Apache Spark en Cloud Dataproc

46089 opiniones

Unable to finish lab due to error Modified INPUT for LAB from pyspark.sql import SparkSession, SQLContext, Row gcs_bucket='[qwiklabs-gcp-01-31c23a3b2c2f]' spark = SparkSession.builder.appName("kdd").getOrCreate() sc = spark.sparkContext data_file = "gs://"+gcs_bucket+"//kddcup.data_10_percent.gz" raw_rdd = sc.textFile(data_file).cache() raw_rdd.take(5) OUTPUT: Setting default log level to "WARN". To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel). 24/11/18 23:53:00 INFO SparkEnv: Registering MapOutputTracker 24/11/18 23:53:00 INFO SparkEnv: Registering BlockManagerMaster 24/11/18 23:53:00 INFO SparkEnv: Registering BlockManagerMasterHeartbeat 24/11/18 23:53:00 INFO SparkEnv: Registering OutputCommitCoordinator --------------------------------------------------------------------------- IllegalArgumentException Traceback (most recent call last) /tmp/ipykernel_13667/2491634418.py in <cell line: 8>() 6 data_file = "gs://"+gcs_bucket+"//kddcup.data_10_percent.gz" 7 raw_rdd = sc.textFile(data_file).cache() ----> 8 raw_rdd.take(5) /usr/lib/spark/python/pyspark/rdd.py in take(self, num) 1848 """ 1849 items: List[T] = [] -> 1850 totalParts = self.getNumPartitions() 1851 partsScanned = 0 1852 /usr/lib/spark/python/pyspark/rdd.py in getNumPartitions(self) 597 2 598 """ --> 599 return self._jrdd.partitions().size() 600 601 def filter(self: "RDD[T]", f: Callable[[T], bool]) -> "RDD[T]": /opt/conda/miniconda3/lib/python3.10/site-packages/py4j/java_gateway.py in __call__(self, *args) 1319 1320 answer = self.gateway_client.send_command(command) -> 1321 return_value = get_return_value( 1322 answer, self.gateway_client, self.target_id, self.name) 1323 /usr/lib/spark/python/pyspark/sql/utils.py in deco(*a, **kw) 194 # Hide where the exception came from that shows a non-Pythonic 195 # JVM exception message. --> 196 raise converted from None 197 else: 198 raise IllegalArgumentException: java.net.URISyntaxException: Malformed IPv6 address at index 6: gs://[qwiklabs-gcp-01-31c23a3b2c2f]/kddcup.data_10_percent.gz

Richard S. · Se revisó hace más de 1 año

Syed Dameem K. · Se revisó hace más de 1 año

Çağrı K. · Se revisó hace más de 1 año

Anthony R. · Se revisó hace más de 1 año

Christopher H. · Se revisó hace más de 1 año

Azhar B. · Se revisó hace más de 1 año

Clément P. · Se revisó hace más de 1 año

César R. · Se revisó hace más de 1 año

Sanjay V. · Se revisó hace más de 1 año

Naethree P. · Se revisó hace más de 1 año

Mohan Babu N. · Se revisó hace más de 1 año

Ignacio G. · Se revisó hace más de 1 año

Juannean Y. · Se revisó hace más de 1 año

Creative P. · Se revisó hace más de 1 año

more examples using jobs from using service schedulers or schedule using cron from SSH

Jeinner Daniel B. · Se revisó hace más de 1 año

Denever D. · Se revisó hace más de 1 año

paul M. · Se revisó hace más de 1 año

Jason M. · Se revisó hace más de 1 año

Sebastian H. · Se revisó hace más de 1 año

Godspower W. · Se revisó hace más de 1 año

Bhavesh S. · Se revisó hace más de 1 año

Mykola K. · Se revisó hace más de 1 año

good

Mohammed G. · Se revisó hace más de 1 año

ぜんぜんわからん

ョ リ. · Se revisó hace más de 1 año

Couldn't complete lab, the Jupyter link didn't work!

Atif H. · Se revisó hace más de 1 año

No garantizamos que las opiniones publicadas provengan de consumidores que hayan comprado o utilizado los productos. Google no verifica las opiniones.