Man pages for malsch/occupationCoding
Supervised Learning for Occupation Coding

accuracy	Accuracy
asDocumentTermMatrix	Document-Term Matrix
calcAccurateAmongTopK	Calculate aggregate properties for top k predicted categories
coding_index_excerpt	An excerpt from the Gesamtberufsliste der BA
cosineSimilarity	Cosine Similarity
createDescriptives	Describe occupational data
createSimilarityTableStringdist	Similarity Table with Coding index
createSimilarityTableSubstring	Similarity Table with Coding index
createSimilarityTableWordwiseStringdist	Wordwise Similarity Table with Coding index
expandPredictionResults	Expands predicted datasets to contain all allowed codes
frequent_phrases	Some job titles and job descriptions
kldb2010PlusFive	2010 German Classification of Occupations (KldB 2010)
logLoss	Log loss
occupations	A selection of 250 coded occupational answers
plotAgreementRateVsProductionRate	Plot agreement rate vs. production rate
plotReliabilityDiagram	Reliability Diagram
plotTruePredictionsVsFalsePredictions	Plot true predictions versus false predictions
predictCreecysMemoryBasedReasoning	Predict codes with Creecys Memory-based reaoning model
predictGweonsNearestNeighbor	Predict codes with Gweons Nearest Neighbor Method
predictLogisticRegressionWithPenalization	Predict codes using a logistic regression model
predictSimilarityBasedReasoning	Predict codes using a Similarity Based Probability Model
predictWithCodingIndex	Code answers with a coding index
predictXgboost	Predict codes using an extreme gradient boosted tree model
prepare_German_coding_index_Gesamtberufsliste_der_BA	Prepares the Gesamtberufsliste der BA to be used with this...
produceResults	Produces summaries of predictive performance
removeFaultyAndUncodableAnswers_And_PrepareForAnalysis	Data Preparation
selectMaxProbMethod	From multiple prediction methods, select the prediction...
sharpness	Sharpness
stringPreprocessing	Preprocess German occupational text
surveyCountsSubstringSimilarity	Anonymized training data (substring similarity) to be used...
surveyCountsWordwiseSimilarity	Anonymized training data (wordwise similarity) to be used...
trainCreecysMemoryBasedReasoning	Train Creecys Memory-based reaoning model
trainGweonsNearestNeighbor	Trains Gweons Nearest Neighbor model
trainLogisticRegressionWithPenalization	Train a logistic regression model with penalization
trainSimilarityBasedReasoning	Train Similarity Based Probability Model
trainSimilarityBasedReasoning2	Train Similarity Based Probability Model with anonymized...
trainXgboost	Train an extreme gradient boosted tree model