回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我正在尝试预处理数据。你知道吗</p>
<pre><code>data = {'Country':['Germany', 'Turkey', 'England', 'Turkey', 'Germany', 'Turkey'],
'Age':['44', '32', '27', '29', '31', '25'],
'Salary':['5400', '8500', '7200', '4800', '6200', '10850'],
'Purchased':['yes', 'yes', 'no', 'yes', 'no', 'yes']}
df = pd.DataFrame(data)
X = df.iloc[:,0].values
</code></pre>
<p>预期结果如下:</p>
<pre><code>|---|---|---|----|-------|---|
| 1 | 0 | 0 | 44 | 5400 | 1 |
| 0 | 1 | 0 | 32 | 8500 | 1 |
| 0 | 0 | 1 | 27 | 7200 | 0 |
| 0 | 1 | 0 | 29 | 4800 | 1 |
| 1 | 0 | 0 | 31 | 6200 | 0 |
| 0 | 1 | 0 | 25 | 10850 | 1 |
</code></pre>
<p>下面是失败的代码。你知道吗</p>
<pre><code>from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
ct = ColumnTransformer([("city_category", OneHotEncoder(dtype='int'), [0])], remainder="passthrough")
X = ct.fit_transform(X)
</code></pre>
<p>输出:</p>
<pre><code>IndexError: tuple index out of range
</code></pre>
<p>我想学习在这种情况下如何使用ColumnTransformer函数?你知道吗</p>