Nevoie pentru a converti lista de dataframe în pyspark

0

Problema

Am codul de mai jos în Python, dar am nevoie pentru a converti la pyspark,

qm1['c1'] = [x[0] in x[1] for x in zip(qm1['id'], qm1['question'])]
qm1['c1'] = qm1['c1'].astype(str)
qm1a = qm1[(qm1.c1 == 'True')]

Ieșirea din acest cod python este

întrebare cheie id c1
Femei 0 semn Adevărat
masina 0 mac Adevărat

Ar putea cineva să mă ajute la fel ca eu sunt un incepator in Python?

dataframe list pyspark python
2021-11-24 06:36:36
1

Cel mai bun răspuns

1

aici este meu de test (ca intrebarea ta nu conține orice)

df.show()
+--------+---+----+
|question|key|  id|
+--------+---+----+
|   Women|  0|omen|
| machine|  2| mac|
|     foo|  1| bar|
+--------+---+----+

si codul pentru a crea rezultatul așteptat :

from pyspark.sql import functions as F

df = df.withColumn("c1", F.col("question").contains(F.col("id")))
df.show()
+--------+---+----+-----+
|question|key|  id|   c1|
+--------+---+----+-----+
|   Women|  0|omen| true|
| machine|  2| mac| true|
|     foo|  1| bar|false|
+--------+---+----+-----+

apoi, puteți pur și simplu filter pe c1:

df.where("c1").show()
+--------+---+----+----+
|question|key|  id|  c1|
+--------+---+----+----+
|   Women|  0|omen|true|
| machine|  2| mac|true|
+--------+---+----+----+
2021-11-24 08:58:50

În alte limbi

Această pagină este în alte limbi

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................