Recent am început să lucrez la Databricks și am fost încercarea de a găsi o modalitate de a efectua o îmbinare declarație pe un Delta de masă, deși folosind o R api (de preferință sparklyr). Scopul final este de a cumva să impună un "duplicat" constrângere așa cum este descris aici. În documentația menționată mai sus descrie Python flux de lucru :
deltaTable.alias("logs").merge(
newDedupedLogs.alias("newDedupedLogs"),
"logs.uniqueId = newDedupedLogs.uniqueId") \
.whenNotMatchedInsertAll() \
.execute()
cu toate acestea, mă întrebam dacă există un mod de a realiza acest lucru printr-R. Orice ajutor/idei pe această temă va fi mult mai apreciat din moment ce eu sunt un utilizator nou (ca mai sus). Multumesc anticipat!