书栈网 · BookStack 本次搜索耗时 0.020 秒,为您找到 1161 个相关结果.
  • mindspore.train

    mindspore.train mindspore.train SummaryRecord. User can use SummaryRecord to dump the summary data, the summary is a series of operationsto collect data for analysis and visua...
  • Create Executor

    Create Executor Minimum working example Using Executors with AsyncIO Constructor Subclass __init__ Passing arguments Create Executor Executor process DocumentArray in-p...
  • 梯度消失/爆炸问题

    梯度消失/爆炸问题 正如我们在第 10 章中所讨论的那样,反向传播算法的工作原理是从输出层到输入层,传播误差的梯度。 一旦该算法已经计算了网络中每个参数的损失函数的梯度,它就使用这些梯度来用梯度下降步骤来更新每个参数。 不幸的是,梯度往往变得越来越小,随着算法进展到较低层。 结果,梯度下降更新使得低层连接权重实际上保持不变,并且训练永远不会收敛到良好的...
  • 5.7. 内核近似

    5.7. 内核近似 5.7.1. 内核近似的 Nystroem 方法 5.7.2. 径向基函数内核 5.7.3. 加性卡方核 5.7.4. Skewed Chi Squared Kernel (偏斜卡方核?暂译) 5.7.5. 数学方面的细节 5.7. 内核近似 校验者: @FontTian @numpy @Loopy 翻译者: @程威 ...
  • Training a Text Classifier

    645 2021-03-31 《The fastai book》
    Training a Text Classifier Language Model Using DataBlock Fine-Tuning the Language Model Saving and Loading Models Text Generation Creating the Classifier DataLoaders Fine-Tun...
  • Consistent & Mirrored View

    Consistent & Mirrored View Data Parallelism and Model Parallelism. Data Parallelism Diagram Model Parallelism Diagram Two Types of Placeholder Using Mirrored View in OneFlow Co...