Mit Kettle lassen sich elegant Excel-Dateien hochladen und somit beliebige Daten in die Datenbank integrieren. Der Vorteil gegenüber dem CSV-Format ist, dass Sie bspw. Formeln nutzen, weitere Tabenblätter anlegen oder Notizen machen können. Folgend ein kleines Beispiel, um die wichtigsten Schritte zu erläutern:
Der Kettle-Job besteht lediglich aus einem Start- und Success-Step, sowie einer Transformation. Trotzdem benötigen wir einen Job, da nur Jobs im System ausgeführt werden können.
Die Transformation besteht aus einem "Microsoft Excel Input"-Step und einem "Table Output"-Step.
Im "Microsoft Excel Input"-Step ist es wichtig im Reiter Files die Variable ${PATH_TO_UPLOADFILE} anzugeben. Diese muss zuvor dem Job als Parameter bekanntgemacht werden.
Um Parameter zu setzen Doppelklicken Sie im Job auf das freie Feld.
Im Reiter Sheets wird angegeben wie das Tabellenblatt der Excel-Datei heißt, welches die Daten enthält. Zudem wird die Spalte in die Zeile angegeben, ab welcher die Daten erfasst sind. Die Zählung beginnt bei 0, das bedeutet in unserem Beispiel werden die Daten aus dem Tabellenblatt prof_bewertung ab Zelle A4 ausgelesen. Falls Sie eine Kopfzeile nutzen, muss die Kopfzeile in Zelle A4 beginnen.
Im Reiter Content wird angegeben, dass die Excel-Datei eine Kopfzeile besitzt, bevor die hochzuladenden Daten folgen. Dies können Sie nutzen, um Spaltenüberschriften zu setzen.
Im Excel beginnt die Kopzeile in Zelle A4. Darunter folgen die hochzuladenden Daten. Die übrige Exceldatei kann beliebig gestaltet werden.
Im Reiter Fields werden die eingelesenen Felder definiert.
Im "Table-Output"-Step wird die Datenbankverbindung und Zieltabelle angegeben. Zudem erfolgt die Zuordnung der Felder aus dem Kettle-Stream, welche zuvor im "Microsoft Excel Input"-Step im Reiter Fields definiert wurden, zu den Feldern der Datenbanktabelle.